group-telegram.com/begtin/6431
Last Update:
Вышла новая версия Duckdb 1.2.0 [1] что важно - это существенная оптимизация скорости чтения данных. Пишут что обновили парсер для CSV [2] ускорив его до 15% и общие ускорение на 13% по тестам TPC-H SF100.
Из другого важного - CSV парсер теперь поддерживает кодировки UTF-16 и Latin-1. Это хорошо, но пока недостаточно. Один из актуальных недостатков DuckDB в том что до сих пор он поддерживал только CSV файлы в кодировке UTF-8, а из всех остальных кодировок данные надо было преобразовывать. Почему так лично я до сих пор не знаю, подозреваю что дело в том что команда DuckDB фокусируется на повышении производительности.
Там есть и другие изменения, но, в целом, менее значимые. Основные сценарии использования DuckDB связаны с парсингом CSV и работой с другими дата-файлами и с общей производительностью.
Ссылки:
[1] https://duckdb.org/2025/02/05/announcing-duckdb-120
[2] https://github.com/duckdb/duckdb/pull/14260
#opensource #duckdb #datatools #rdbms
BY Ivan Begtin
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/hlYlSrJEDSlXg2vRlmrXyEK1kJUbSKvFpK0ULQyGLguWGVi9vN3lk8O4sMgdZ2fTdY9jtKKzKYItbXoRO_00zXm2njaXnuTdRY9T78NMpPnrlqDklInmapmrN9AsDSAwqwfJOhF6nreLaX4YzNJKckfQGQL6FDeYfYacGyY1JhLio6ZpDGZaRlIGvQHY-1MhNtSAD6Yh-kWVxb1mWR5czqsWAJstECQTVyHsQcQofaQotn6iW9CzJNIDBfwp16BwrHbPBs_EihGgehbFPOpULKZXCQ_WrrP30dpVeJjXr2wJNWGM1KLSfggc8aDhDVgOT9fjUeMD2G1-qU6VcGylJA.jpg)
Share with your friend now:
group-telegram.com/begtin/6431