Как сделать выбор между OpenTSDB и InfluxDB или другими TSDS?

Они оба являются базами данных с открытым исходным кодом распределенных временных рядов, OpenTSDB для показателей, InfluxDB для показателей и событий без внешних зависимостей, с другой OpenTSDB на основе HBase.

Любое другое сравнение между ними?

И если я хочу хранить и запрашивать | анализировать показатели в режиме реального времени без потери ухудшения на основе временных рядов, что было бы лучше?

Ответы

Ответ 1

На одной из конференций я слышал, что люди запускали что-то вроде Graphite/OpenTSDB для централизованного сбора показателей и InfluxDB на каждом сервере для сбора показателей только для этого сервера. (InfluxDB был выбран для локального хранилища, поскольку он легко развертывается и облегчается по памяти).

Это напрямую не связано с вашим вопросом, но идея понравилась мне, поэтому я хотел поделиться ею.

Ответ 2

Warp 10 - это еще один вариант, который стоит рассмотреть (я часть команды его создания), проверьте его на http://www.warp10.io/.

Он основан на базе HBase, но также имеет автономную версию, которая будет отлично работать для томов в миллиардах точек данных с низкими 100-ми столами, поэтому она должна соответствовать большинству вариантов использования.

Среди достоинств Warp 10 - язык WarpScript, который построен с нуля для манипулирования (Geo) Time Series.

Ответ 3

Еще один вариант с открытым исходным кодом - blueflood: http://blueflood.io.

Отказ от ответственности: как и Пол Дикс, я склонен к тому, что я работаю над Blueflood.

В соответствии с вашим кратким списком требований, я бы сказал, что Blueflood подходит. Возможно, если вы можете указать размер вашего набора данных, тип анализа, который вам нужно запустить, или любые другие требования, которые, по вашему мнению, делают ваш проект уникальным, мы могли бы помочь вам в более точном ответе. Не зная больше о том, что вы хотите сделать, нам будет сложно ответить более значимо.