В чем преимущество RDF и Triple Storage для Neo4j?
Neo4j - очень быстрая и масштабируемая база данных графов, кажется, что она может быть использована в бизнес-проектах, и она также бесплатна!
В то же время нет трех магазинов RDF, которые хорошо работают с большими данными или обеспечивают высокоскоростной доступ. Более того, бесплатные трехмерные магазины RDF работают еще хуже.
Так в чем же преимущество тройных магазинов RDF и RDF для Neo4j?
Ответы
Ответ 1
Преимущество использования трехмерного хранилища для RDF, а не Neo4j, заключается в том, для чего они предназначены. Neo4j довольно хорош для многих случаев использования, но по моему опыту его производительность для загрузки и запроса RDF значительно ниже всех выделенных баз данных RDF.
Ошибочно, что базы данных RDF не масштабируются или не быстрые. Несомненно, они еще не достигли уровня производительности и масштаба, который есть в реляционных базах данных, но у них есть 50-летний старт. Многие тройные магазины масштабируются в миллиарды троек, обеспечивают "стандартные" функции предприятия и обеспечивают отличную производительность для многих случаев использования.
Если вы собираетесь использовать RDF для проекта, используйте трехмерный магазин; он будет обеспечивать лучшую производительность и набор функций /API для работы с RDF для создания вашего приложения.
Ответ 2
RDF и SPARQL - это стандарты, поэтому у вас есть выбор из нескольких реализаций и вы можете перенести данные из одного хранилища RDF в другой.
Кроме того, версия 1.1 языка запросов SPARQL довольно сложна (более выразительна, чем большинство реализаций SQL), и может выполнять всевозможные запросы, для которых требуется много кода для написания в Neo4J.
Ответ 3
Если вы собираетесь для построения графа (например, обход графика) по троек, neo4j - хороший выбор. Для больших троек вы можете использовать свой пакетный запрос, который довольно быстр.
Ответ 4
Я слышал слухи, что для загрузки 10M троек в Neo4j требуется целый день (это на самом деле самый медленный, потому что он не построен в основном для RDF).
Sesame и 4Store являются самыми быстрыми, но у Jena есть мощный API.