Apache Druid

Druid — это ориентированное на столбцы распределенное хранилище данных с открытым исходным кодом, написанное на Java

Официальный сайт

Категория: Темы: OLAP БД

Описание

Apache Druid – это колоночная открытая база данных, написанная на Java.

Druid спроектирован с целью быстрой обработки больших, редко изменяющихся массивов данных и немедленного предоставления доступа к ним. Он был разработан с целью обслуживания и поддержания 100% времени безотказной работы перед лицом развертывания кода, сбоев машин и других возможностей производственной системы. Это может быть полезно и для бэк-офисных случаев, но проектные решения были явно направлены на постоянную работу.

Друид подходит для продуктов, которые требуют приема данных в реальном времени из одного большого потока данных. Особенно, если вы ориентируетесь на работу без простоя и создаете свой продукт поверх ориентированного на время суммирования входящего потока данных. Говоря о скорости запроса, важно уточнить, что означает «быстрый»: с друидом он полностью находится в пределах возможности для достижения запросов, которые выполняются менее чем через секунду через триллионы строк данных.

Особенности Druid

  • Колоночное хранение данных
  • Мощная параллельная обработка данных
  • Возможность работы в режиме реального времени или в фоновом режиме
  • Облачная отказоустойчивая архитектура
  • Быстрая фильтрация
  • Точные и аппроксимированные вычисления

Аналоги и Альтернативы для Apache Druid

Ключевые Особенности: OLAP БД

Amazon Athena

Amazon Athena – это интерактивный сервис запросов, позволяющий просто анализировать данные в хранилище Amazon S3 с помощью стандартного SQL

Apache Pinot

Apache Pinot (Incubating) - распределенное хранилище данных OLAP в реальном времени

MongoDB

MongoDB — документоориентированная система управления базами данных (СУБД) с открытым исходным кодом, не требующая описания схемы таблиц. Классифицирована как NoSQL, использует JSON-подобные документы и схему базы данных. Написана на языке C++

ClickHouse

ClickHouse - столбцовая система управления базами данных (СУБД) для онлайн обработки аналитических запросов (OLAP)

Сравнение Apache Druid и похожих решений

Рассмотрим плюсы и минусы, преимущества Apache Druid относительно других решений

Сравнение открытых OLAP-систем Big Data: ClickHouse, Druid и Pinot

ClickHouse, Druid и Pinot — три открытых хранилища данных, которые позволяют выполнять аналитические запросы на больших объемах данных с интерактивными задержками. «Сегментированный» подход к управлению данными в Druid и Pinot против […]

Смотреть все сравнения с Apache Druid

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *