Что такое куст, это база данных?

Я только начал изучать Улей. Он имеет все структуры, похожие на RDBMS, такие как таблицы, объединения, разделы. Я понимаю, что Hive по-прежнему использует HDFS для хранения, и это абстракция HDFS для SQL. Из этого я не уверен, что погода - это решение для базы данных, такое как HBase, Cassnadra.. или просто это система запросов поверх HDFS. Я не думаю, что это просто язык запроса, потому что он имеет таблицы, объединения и разделы.

Ответы

Ответ 1

Hive - это пакет/инфраструктура хранилища данных, построенная поверх Hadoop. Он предоставляет диалоги SQL, называемые языком запросов Hive (HQL) для запросов к данным, хранящимся в кластере Hadoop. HQL - это язык запросов Hive. Как и все диалекты SQL, которые широко используются, он не полностью соответствует какой-либо конкретной версии стандарта ANSI SQL. Это, возможно, ближе всего к диалекту MySQL, но со значительными различиями. Hive не поддерживает вставки, обновления и удаления ряда строк. Hive не поддерживает транзакции. Поэтому мы не можем сравнивать его с РСУБД. Hive добавляет расширения, чтобы обеспечить лучшую производительность в контексте Hadoop и интегрироваться с пользовательскими расширениями и даже внешними программами. Он хорошо подходит для данных пакетной обработки, таких как: Обработка журналов, интеллектуальная обработка текста, индексирование документов, бизнес-аналитика, ориентированная на клиента, Предиктивное моделирование, тестирование гипотез и т.д.

Hive не предназначен для обработки онлайн-транзакций и не предлагает запросы в режиме реального времени.