Apache Pinot

Apache Pinot (Incubating) – распределенное хранилище данных OLAP в реальном времени

Подробнее...
Категория: Метка:

Описание

Apache Pinot – это распределенное хранилище данных OLAP в реальном времени, которое используется для предоставления масштабируемой аналитики в реальном времени с низкой задержкой. Он может принимать данные из автономных источников данных (таких как Hadoop и простые файлы), а также из онлайн-источников (таких как Kafka). Pinot рассчитан на горизонтальное масштабирование.

Особенности Apache Pinot

  • Колонно-ориентированная база данных с различными схемами сжатия, такими как длина цикла, фиксированная длина битов
  • Сменные технологии индексации – отсортированный индекс, битовый индекс, инвертированный индекс, индекс звездного дерева
  • Возможность оптимизировать план запроса / выполнения на основе метаданных запроса и сегмента.
  • Прием пищи в режиме реального времени от Kafka и прием пищи от Hadoop
  • SQL-подобный язык, который поддерживает выбор, агрегацию, фильтрацию, группирование, упорядочение по, отдельные запросы к фактическим данным
  • Поддержка многозначных полей
  • Горизонтально масштабируемый и отказоустойчивый

 

Ограничения сервиса

  • Пино не является заменой для базы данных, то есть он не может быть использован в качестве источника хранилища правды, не может изменять данные
  • Хотя Pinot поддерживает текстовый поиск, он не заменяет поисковую систему, т.е. релевантность не поддерживается.
  • Запрос не может охватывать несколько таблиц. Используйте соединитель Presto-Pinot для объединения и других функций.

 

Пино работает очень хорошо для запроса данных временных рядов с большим количеством измерений и метрик. Пример. Запрос (просмотры профиля, эффективность рекламной кампании и т. Д.) Аналитическим способом (кто просматривал этот профиль за последние недели, сколько объявлений было кликнуто за кампанию).

Аналоги и альтернативы для Apache Pinot

Apache Pinot - похожие решения и продукты

Ключевые Особенности: OLAP БД

Amazon Athena

Amazon Athena – это интерактивный сервис запросов, позволяющий просто анализировать данные в хранилище Amazon S3 с помощью стандартного SQL

Apache Druid

Druid – это ориентированное на столбцы распределенное хранилище данных с открытым исходным кодом, написанное на Java

MongoDB

MongoDB — документоориентированная система управления базами данных (СУБД) с открытым исходным кодом, не требующая описания схемы таблиц. Классифицирована как NoSQL, использует JSON-подобные документы и схему базы данных. Написана на языке C++

ClickHouse

ClickHouse – столбцовая система управления базами данных (СУБД) для онлайн обработки аналитических запросов (OLAP)

Сравнение Apache Pinot и похожих решений

Рассмотрим плюсы и минусы, преимущества Apache Pinot относительно других решений

Posted inДайджест, Сравнение

Сравнение открытых OLAP-систем Big Data: ClickHouse, Druid и Pinot

ClickHouse, Druid и Pinot — три открытых хранилища данных, которые позволяют выполнять аналитические запросы на больших объемах данных с интерактивными задержками. «Сегментированный» подход к управлению данными в Druid и Pinot против более простого управления данными в ClickHouse определяет многие аспекты систем. Однако, важно заметить, что это различие оказывает небольшое (или не оказывает вовсе) влияние на потенциальную эффективность сжатия (впрочем, история про компрессию для всех трех систем имеет […]

Смотреть все сравнения с Apache Pinot

Отзывы

Отзывов пока нет.

Будьте первым, кто оставил отзыв на “Apache Pinot”

Ваш адрес email не будет опубликован. Обязательные поля помечены *