Ответ 1
Hive - это пакет/инфраструктура хранилища данных, построенная поверх Hadoop. Он предоставляет диалоги SQL, называемые языком запросов Hive (HQL) для запросов к данным, хранящимся в кластере Hadoop. HQL - это язык запросов Hive. Как и все диалекты SQL, которые широко используются, он не полностью соответствует какой-либо конкретной версии стандарта ANSI SQL. Это, возможно, ближе всего к диалекту MySQL, но со значительными различиями. Hive не поддерживает вставки, обновления и удаления ряда строк. Hive не поддерживает транзакции. Поэтому мы не можем сравнивать его с РСУБД. Hive добавляет расширения, чтобы обеспечить лучшую производительность в контексте Hadoop и интегрироваться с пользовательскими расширениями и даже внешними программами. Он хорошо подходит для данных пакетной обработки, таких как: Обработка журналов, интеллектуальная обработка текста, индексирование документов, бизнес-аналитика, ориентированная на клиента, Предиктивное моделирование, тестирование гипотез и т.д.
Hive не предназначен для обработки онлайн-транзакций и не предлагает запросы в режиме реального времени.