Amazon Athena
Amazon Athena – это интерактивный сервис запросов, позволяющий просто анализировать данные в хранилище Amazon S3 с помощью стандартного SQL
Описание
Amazon Athena – это интерактивный сервис запросов, позволяющий легко анализировать данные в хранилище Amazon S3 с помощью стандартных средств SQL.
Особенности Amazon Athena
- Athena – бессерверный сервис, где нет инфраструктуры, требующей настройки или управления, поэтому можно сразу же приступить к анализу данных. Не нужно даже загружать данные в Athena, поскольку сервис работает непосредственно с данными, хранимыми в S3.
- Сервис Amazon Athena использует Presto с полной поддержкой стандартных запросов SQL и работает с различными стандартными форматами данных, включая CSV, JSON, ORC и Apache Parquet и Avro.
- Amazon Athena идеально подходит для быстрой и спонтанной отправки запросов, легко интегрируется с Amazon QuickSight, обеспечивая удобную визуализацию, а также может выполнять сложные задачи анализа с использованием масштабных операций объединения, оконных функций и массивов.
- Amazon Athena помогает анализировать данные, хранящиеся в Amazon S3.
- Athena можно использовать для выполнения спонтанных запросов с помощью ANSI SQL – без необходимости объединять данные или загружать их в Athena.
- Amazon Athena может обрабатывать неструктурированные, полуструктурированные и структурированные пакеты данных. В их число входят CSV, JSON, Avro или столбцовые форматы данных, такие как Apache Parquet и Apache ORC.
- Сервис Amazon Athena интегрирован с Amazon QuickSight, что обеспечивает удобную визуализацию.
- Amazon Athena также можно использовать для формирования отчетов либо просмотра данных с применением инструментов бизнес-аналитики или SQL-клиентов, подключенных с помощью драйвера ODBC или JDBC.
Аналоги и Альтернативы для Amazon Athena
Apache Pinot
Apache Pinot (Incubating) - распределенное хранилище данных OLAP в реальном времени
Apache Druid
Druid - это ориентированное на столбцы распределенное хранилище данных с открытым исходным кодом, написанное на Java
MongoDB
MongoDB — документоориентированная система управления базами данных (СУБД) с открытым исходным кодом, не требующая описания схемы таблиц. Классифицирована как NoSQL, использует JSON-подобные документы и схему базы данных. Написана на языке C++
ClickHouse
ClickHouse - столбцовая система управления базами данных (СУБД) для онлайн обработки аналитических запросов (OLAP)
Блог, обзоры, новости
Аналитика логов Nginx с помощью Amazon Athena и Cube.js
Обычно для мониторинга и анализа работы Nginx используют коммерческие продукты или готовые open-source альтернативы, такие как Prometheus + Grafana. Это хороший вариант для мониторинга или real-time аналитики, но не слишком…
Отзывы
Плюсы и минусы продукта
Отзывов пока нет.