Сравнение открытых OLAP-систем Big Data: ClickHouse, Druid и Pinot

Сравнение открытых OLAP-систем Big Data: ClickHouse, Druid и Pinot

  • ClickHouseDruid и Pinot — три открытых хранилища данных, которые позволяют выполнять аналитические запросы на больших объемах данных с интерактивными задержками.
  • «Сегментированный» подход к управлению данными в Druid и Pinot против более простого управления данными в ClickHouse определяет многие аспекты систем. Однако, важно заметить, что это различие оказывает небольшое (или не оказывает вовсе) влияние на потенциальную эффективность сжатия (впрочем, история про компрессию для всех трех систем имеет печальный конец по нынешнему состоянию дел), или на скорость обработки запросов.
  • ClickHouse похож на традиционные RDMBS, например, PostgreSQL. В частности, ClickHouse можно развернуть на всего один сервер. Если планируемый размер невелик — скажем, не больше порядка 100 ядер CPU для обработки запросов и 1 TB данных, я бы сказал, что ClickHouse имеет значительные преимущества перед Druid и Pinot в силу своей простоты и отсутствия необходимости в дополнительных типах узлов, таких как «мастер», «узлы поглощения в реальном времени», «брокеры». На этом поле, ClickHouse соревнуется скорее с InfluxDB, чем с Druid или Pinot.
  • Druid and Pinot похож на системы Big Data вроде HBase. Здесь в виду имеются не характеристики производительности, а зависимость от ZooKeper, зависимость от персистентного реплицируемого хранилища (к примеру, HDFS), сосредоточение внимания на устойчивости к отказам отдельных узлов, а также автономная работа и управление данными, не требующими постоянного внимания человека. Для широкого спектра приложений, ни ClickHouse, ни Druid или Pinot не являются очевидными победителями. 
  • Вы сможете ознакомиться с более детальным сравнением этих систем, пройдя по ссылке в источнике.
Информация была полезна для вас?

Расскажите пожалуйста что мы можем улучшить?


Обзор Apache Druid

Разработка Druid - это ориентированное на столбцы распределенное хранилище данных с открытым исходным кодом, написанное на Java

Подробнее...


Обзор Apache Pinot

Разработка Apache Pinot (Incubating) - распределенное хранилище данных OLAP в реальном времени

Подробнее...


Обзор ClickHouse

Бизнес процессы, Разработка ClickHouse - столбцовая система управления базами данных (СУБД) для онлайн обработки аналитических запросов (OLAP)

Подробнее...

Следующая записьЕще статьи