Ответ 1
Datastax Community Edition также бесплатна, он содержит базовую версию OpsCenter - http://planetcassandra.org/cassandra/
Вот разница между версией сообщества и DSE
Является ли Datastax Cassandra единственным доступным Cassandra, который можно использовать в производственной среде? Есть ли свободные альтернативы? Как насчет кассандры, доступной на сайте Apache?
Datastax Community Edition также бесплатна, он содержит базовую версию OpsCenter - http://planetcassandra.org/cassandra/
Вот разница между версией сообщества и DSE
Оба они могут использоваться в производстве. DataStax Enterprise поставляется с множеством дополнительных функций поверх Apache Cassandra, а также имеет поддержку.
Apache Cassandra всегда опережает Datastax Cassandra в версии и новейшем Spark 2.x.x не включен в DataStax Enterprise. Один из способов заставить Cassandra 3.x работать с Spark 2.x - установить Apache Spark и Apache Cassandra с открытым исходным кодом отдельно и использовать разъем искры cassandra. Вам не нужен Datastax Enterprise, просто добавьте одну строку в конфигурацию Spark, как описано ниже, и вы сохранили тысячи долларов за лицензионные сборы.
# Configuration example with Spark 2.1.1 and Cassandra 3.x:
$ vi /usr/local/spark-2.1.1/conf/spark-defaults.conf
\__ spark.jars.packages datastax:spark-cassandra-connector:2.0.1-s_2.11
$ spark-shell
Datastax Enterprise также использует OpsCenter, который замедляет работу кластера Cassandra, поэтому рекомендуется иметь другой сервер, посвященный OpsCenter, и с Apache Cassandra вы получите лучшую производительность без использования OpsCenter и вместо использования командной строки nodetool.
DataStax Enterprise Solr Search, когда он включен, значительно замедлит работу всего кластера Cassandra и часто приведет к полному обходу или завершению работы всего кластера при добавлении большего количества записей и удалении из кластера. Это происходит потому, что Lucene не способен идти в ногу с индексацией, добавлением, удалением документов и оптимизацией индекса.
Datastax Enterprise использует Solr/Lucene, а Структура индексированных индексов Lucene Inverted несовместима с распределяемыми системами. Этот индекс был включен в Datastax Enterprise и ElasticSearch, утверждая, что поисковая система имеет теперь распространяемый индекс, который не соответствует действительности. Распределяемый индекс - это когда поисковый запрос работает только с одним сервером, а не с несколькими серверами. Таким образом, индекс Lucene не является распределенным индексом, и во время поиска координатор node должен отправить поисковый запрос на каждый node в кластере, а затем объединить верхний результат с каждым node. Поэтому больше узлов, которые вы добавите к такому кластеру более медленный и более непоследовательный результат, вы получите при использовании Solr/Lucene с Datastax Enterprise или ElasticSearch
Вывод: DataStax Enterprise с включенным Solr или ElasticSearch, написанным на Java, способен искать до 100 миллионов документов, а на нескольких серверах возвращаются больше нерелевантных результатов по мере добавления большего количества серверов в кластер с запросом на длительность в несколько секунд или минут. Xapian библиотека поисковой системы с открытым исходным кодом, написанная на С++, способна искать менее 4 миллиардов документов на одном сервере с использованием вероятностного алгоритма поиска BM25 менее чем за секунду.
Примеры поиска 1 + миллиарда документов с использованием Xapian на одном сервере
Помимо Apache Cassandra, Scylla, который является заменой для Cassandra, написанной на С++. Он утверждает, что он в 10 раз быстрее, чем Apache Cassandra. Тем не менее, Scylla все еще находится в альфа-версии, и вы должны держаться подальше от нее в производственной среде.
Scylla стремится поддерживать все функции cassandra вместе с инструментами. Он также поддерживает мониторинг JMX.
Datastax - коммерческая компания, которая поддерживает C *. Базовый исходный код Cassandra взят из Apache Repositories, затем некоторые из их собственного кода объединяются. Помимо этого, как уже упоминалось другими, версия Datastax поставляется с некоторыми дополнительными инструментами для поддержки кластера Cassandra. Одним из преимуществ Datastax Enterprise является их аккуратная SOLR Integration, еще один отличный проект Apache Foundation. Cassandra поставляется с языком запросов CQL (Cassandra Query Language), который "похож" на SQL, однако вы должны думать о CQL, как двоюродный брат SQL, а не брат. Одной из замечательных особенностей выпуска Enterprise является то, что вы можете запрашивать индекс SOLR с помощью интеграции CQL, а также кластер Cassandra Cluster совместно использует ресурсы SOLR, поэтому вам не нужен второй кластер для SOLR. Вы можете... настроить Apache или Datastax Cassandra, вы получите почти одно и то же, но если вам нужно что-то похожее на SQL Like Statement (изначально не доступно в Cassandra), или у вас есть очень денормализованная база данных, и вам нужно возможности поиска, то Datstax Enterprise (DSE) - ваш единственный жизнеспособный выбор. Как уже упоминалось, DSE бесплатно для стартапов, пока они не достигнут годового дохода в размере 3 млн. Долл. США или финансируются за 30 млн. Долл. США. Это должно дать всем возможность использовать возможности NoSQL и использовать одну из самых надежных баз данных для больших данных.
Для продукта Cassandra вы можете использовать предложение с открытым исходным кодом Apache на производстве, если ваша организация удобна с открытым исходным кодом.
Вы также можете использовать версию Cassandra для сообщества Datastax, которая также является открытым исходным кодом и бесплатна для развертывания; что дает вам немного больше уверенности от DataStax, предлагающего коммерческую поддержку.
Затем есть DataStax Enterprise, которая является той версией, которую вы платите за использование, с включенной моделью поддержки. Это все еще использует Cassandra с открытым исходным кодом, с дополнительным кодом из DataStax. Они также выпустили этот выпуск через свои внутренние тестовые процессы, чтобы они были рады его поддержать. Обычно это означает, что выпуски будут отставать от версий Apache и сообщества, если это имеет для вас значение.
Продукт Data Center "Dev Center" - это инструмент графического интерфейса, который позволяет вам вводить команды CQL с установкой Cassandra - он может свободно использоваться для любой версии. Вы можете счесть это полезным, хотя в командной строке CQLSH вам должно быть предложено многое из того, что вам может понадобиться (и CLIS Cassandra).
Продукт DataStax "Ops Center" доступен в бесплатной версии, которая может работать против любой Cassandra с ассоциированным "DataStax Agent", используемым для сбора данных из каждого node. Корпоративная версия Ops Center включает дополнительные функции; который доступен, если вы приобретаете полностью поддерживаемый стек DSE (DataStax Enterprise).
Надеюсь, что это поможет. Гораздо больше информации доступно на сайтах Planet Cassandra и DataStax.
Apache Cassandra также имеет все функции, а также версию сообщества DataStax. Таким образом, вы можете поместить Apache Cassandra в производственный процесс.
Еще одна хорошая особенность DSE - возможность делать резервную копию и восстановление вашей базы данных Cassandra, что, на мой взгляд, очень важно, если вы планируете использовать ее в производственной настройке.