Недостатки хранения двоичных данных в Riak?
Каковы проблемы, если таковые имеются, хранения двоичных данных в Riak?
Оказывает ли это эффект на работоспособность и производительность кластеризации?
Каковы были бы различия в производительности между использованием Riak для этой, а не распределенной файловой системы?
Ответы
Ответ 1
Добавляя к превосходному ответу на Оскар-Годсон, вы, вероятно, столкнетесь с проблемами со значениями, превышающими 50 МБ. Бит-бокс лучше всего подходит для значений, которые составляют до нескольких килобайт. Если вы храните большие значения, вы можете рассмотреть альтернативные серверы хранения, такие как innostore.
У меня нет опыта хранения двоичных значений, но у нас есть кластер среднего размера (5 узлов, порядка 100 М, 10 из ТБ), и мы видим частые ошибки, связанные с вставкой и извлекать значения, размер которых равен 100 КБ. Производительность в этом случае несовместима - несколько раз она срабатывает, другие - нет, поэтому, если вы собираетесь протестировать, проверьте масштаб.
Мы также видим проблемы с большими значениями при запуске запросов с уменьшением размера - они просто теряют время. Однако это может быть менее актуальным для двоичных значений... (как упоминал Мэтт-Ранни).
Также см. @Stephen-C answer здесь
Ответ 2
Единственная проблема, о которой я могу думать, - хранить двоичные данные размером более 50 МБ, которые они советуют. Весь смысл Riak таков:
Еще одна причина, по которой можно было бы забрать Riak для гибкости моделирования ваших данных. Riak будет хранить любые данные, которые вы им сообщаете в агностическом контексте - он делает не применять таблицы, столбцы или ссылочная целостность. Это значит, что ты может хранить двоичные файлы прямо рядом больше программно-прозрачных форматов как JSON или XML.
Источник: Схема схемы в Riak - Введение
Ответ 3
С Riak рекомендуемый максимум составляет 2 МБ на объект. Помимо этого, рекомендуется использовать либо Riak CS, который был протестирован с объектами до 5 ТБ (хранится в Riak как объекты 1 МБ), либо естественным образом разбивает ваш большой объект на 2 МБ фрагменты и связывает ключ и суффикс.
Ответ 4
Я лично не заметил никаких проблем с хранением данных, таких как изображения и документы (как DOC, так и PDF) в Riak. У меня нет номеров производительности, но я могу их запомнить.
Что-то примечание: с помощью Riak вы можете использовать Luwak, который предоставляет api для хранения больших файлов. Это было очень полезно.
Ответ 5
Одна из проблем может заключаться в том, что сложно, если не невозможно, использовать карту JavaScript/сокращение по вашим двоичным данным. Для этого вам, вероятно, понадобится Эрланг.