Семантический поиск в Python для хобби + последние новости
Я хочу реализовать семантический поиск на основе python по набору ключевых слов (в основном, хобби, последние новости и т.д., о которых может интересоваться человек). Я хочу знать, существуют ли базы данных онтологий для тех же алгоритмов/реализации поиска с открытым исходным кодом для того же самого.
Eg. Мой набор = {говорить, пить, чирикать, Катрина Кайф, цирк Катрины, собирать рок, собирать монеты}
Итак, при поиске "накапливать" я мог бы собрать рок-коллекцию и сбор монет в качестве выхода.
Изменить:
Термины могут иметь несколько слов. Это "Президент. Барак Обама из Соединенных Штатов" является действительным запросом.
Ответы
Ответ 1
Возможно, вы захотите использовать "случайную индексацию". Он может делать именно то, что вам нужно, он вычисляет вектор функции для каждого слова и определяет метрику семантической подобия между двумя словами.
Все, что вам нужно, это захватить копию Введение в случайную индексацию и semanticvectors, чтобы вы начали...
Я надеюсь, что это поможет, если вам нужны дополнительные советы, прокомментируйте...
Ответ 2
Надеюсь, но не уверен, что это полезно для вас.
Gnowsys
- все еще находится под сильным развитием