group-telegram.com/begtin/6418
Last Update:
JSONBench [1] свежий бенчмарк для аналитических баз данных работающих с JSON от команды ClickHouse. Ожидаемо в бенчмарке ClickHouse на первых местах ;), но надо отдать им должное, в блоге у них подробный методологический рассказ про это [2] и конкуренты могут прийти и возразить обоснованно, если, конечно, придут.
Сам бенчмарк основан на датасете размером в 482GB в несжатом виде событий из соцсети BlueSky. В сжатом с помощью zstd виде они занимают 124GB, а в ClickHouse 99GB и 622GB в PostgreSQL.
Споры тут могут быть, в основном, исходя из моделей использования и подходов. К примеру, у DuckDB есть тип данных JSON, но в целом с его помощью можно работать с JSON файлами как с таблицами и импортировать их не в JSON тип, а сразу развертывать в табличную форму.
Что я лично и сделал бы с этими данными BlueSky вначале преобразовав из в Parquet.
С другой стороны способность ClickHouse работать с JSON объектами явно растёт и с той точки измерений что они проводили - это хороший тест.
Ссылки:
[1] https://jsonbench.com/
[2] https://clickhouse.com/blog/json-bench-clickhouse-vs-mongodb-elasticsearch-duckdb-postgresql
#clickhouse #postgresql #mongodb #duckdb #benchmark #json #rdbms
BY Ivan Begtin
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/bxWPB-L3O8aoEiqsPQg7YUDU08kUD6QsYbV1jpugGhbynyTRK6iDv7Q6kg3KXY99LliFLrKiUOFBCWvDXa4suEQO1frGbUdaQkXgX26KoNp_02Evf5H47TkTnERCJNuefE8fI7TMga8RIO82MrjpPeEtQaE_PwnU9eOmp5eIMh1TZWsWFwuK0O2LBdQe8aORoOKUq0AYhEdCF2lqi5WtsX_g8mCJf6sxrQ9gbbxAvOAx1v49TcojRAB8SCjOirF9IORcvZAMOjpMeC3D1nDUkqOBUkCBKjw4Y1lBsNLG8Bl7Xm8vKWRnEGPx4NH8o6JxtMxW_wUeQD6v7nw0HW51mg.jpg)
Share with your friend now:
group-telegram.com/begtin/6418