В чем преимущество RDF и Triple Storage для Neo4j?

Neo4j - очень быстрая и масштабируемая база данных графов, кажется, что она может быть использована в бизнес-проектах, и она также бесплатна!

В то же время нет трех магазинов RDF, которые хорошо работают с большими данными или обеспечивают высокоскоростной доступ. Более того, бесплатные трехмерные магазины RDF работают еще хуже.

Так в чем же преимущество тройных магазинов RDF и RDF для Neo4j?

Ответы

Ответ 1

Преимущество использования трехмерного хранилища для RDF, а не Neo4j, заключается в том, для чего они предназначены. Neo4j довольно хорош для многих случаев использования, но по моему опыту его производительность для загрузки и запроса RDF значительно ниже всех выделенных баз данных RDF.

Ошибочно, что базы данных RDF не масштабируются или не быстрые. Несомненно, они еще не достигли уровня производительности и масштаба, который есть в реляционных базах данных, но у них есть 50-летний старт. Многие тройные магазины масштабируются в миллиарды троек, обеспечивают "стандартные" функции предприятия и обеспечивают отличную производительность для многих случаев использования.

Если вы собираетесь использовать RDF для проекта, используйте трехмерный магазин; он будет обеспечивать лучшую производительность и набор функций /API для работы с RDF для создания вашего приложения.

Ответ 2

RDF и SPARQL - это стандарты, поэтому у вас есть выбор из нескольких реализаций и вы можете перенести данные из одного хранилища RDF в другой.

Кроме того, версия 1.1 языка запросов SPARQL довольно сложна (более выразительна, чем большинство реализаций SQL), и может выполнять всевозможные запросы, для которых требуется много кода для написания в Neo4J.

Ответ 3

Если вы собираетесь для построения графа (например, обход графика) по троек, neo4j - хороший выбор. Для больших троек вы можете использовать свой пакетный запрос, который довольно быстр.

Ответ 4

Я слышал слухи, что для загрузки 10M троек в Neo4j требуется целый день (это на самом деле самый медленный, потому что он не построен в основном для RDF).

Sesame и 4Store являются самыми быстрыми, но у Jena есть мощный API.