group-telegram.com/begtin/6431
Last Update:
Вышла новая версия Duckdb 1.2.0 [1] что важно - это существенная оптимизация скорости чтения данных. Пишут что обновили парсер для CSV [2] ускорив его до 15% и общие ускорение на 13% по тестам TPC-H SF100.
Из другого важного - CSV парсер теперь поддерживает кодировки UTF-16 и Latin-1. Это хорошо, но пока недостаточно. Один из актуальных недостатков DuckDB в том что до сих пор он поддерживал только CSV файлы в кодировке UTF-8, а из всех остальных кодировок данные надо было преобразовывать. Почему так лично я до сих пор не знаю, подозреваю что дело в том что команда DuckDB фокусируется на повышении производительности.
Там есть и другие изменения, но, в целом, менее значимые. Основные сценарии использования DuckDB связаны с парсингом CSV и работой с другими дата-файлами и с общей производительностью.
Ссылки:
[1] https://duckdb.org/2025/02/05/announcing-duckdb-120
[2] https://github.com/duckdb/duckdb/pull/14260
#opensource #duckdb #datatools #rdbms
BY Ivan Begtin
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/ugOfK2rI2I2SM7cmtVd81lcJ5oPyaq1aoPmsCGIH6-U3_dfMevt0g-yJx_EBk9nMFFnV5DSgHq8LCdtwLe2RRqq_r4U-GFSyLvpZRXQKgqEkH5EWbO3t9GXzcte9HaGtthe48x5HQjSHgb3GX5nivBXPCvWs3Am5Hn8_-Vj2SKOeM1PKxEZ0758LhlOYHCb30htcqPVUIpUoKv8bkWj69kj6q_c82QGUkP1SXFFn85IonPxLSohrgwjbAOgOQU7JK6xFPV_bZVv3L91qs1HogJ9UUbLSldmtrr3hUHSezNqPPUiF7c7E8-2ryw-Kgesxp5mZuHumvbzLpn-ay6c-RA.jpg)
Share with your friend now:
group-telegram.com/begtin/6431