Семантический поиск в Python для хобби + последние новости

Я хочу реализовать семантический поиск на основе python по набору ключевых слов (в основном, хобби, последние новости и т.д., о которых может интересоваться человек). Я хочу знать, существуют ли базы данных онтологий для тех же алгоритмов/реализации поиска с открытым исходным кодом для того же самого.

Eg. Мой набор = {говорить, пить, чирикать, Катрина Кайф, цирк Катрины, собирать рок, собирать монеты}

Итак, при поиске "накапливать" я мог бы собрать рок-коллекцию и сбор монет в качестве выхода.

Изменить: Термины могут иметь несколько слов. Это "Президент. Барак Обама из Соединенных Штатов" является действительным запросом.

Ответы

Ответ 1

Возможно, вы захотите использовать "случайную индексацию". Он может делать именно то, что вам нужно, он вычисляет вектор функции для каждого слова и определяет метрику семантической подобия между двумя словами.

Все, что вам нужно, это захватить копию Введение в случайную индексацию и semanticvectors, чтобы вы начали...

Я надеюсь, что это поможет, если вам нужны дополнительные советы, прокомментируйте...

Ответ 2

Надеюсь, но не уверен, что это полезно для вас.

Gnowsys

  • все еще находится под сильным развитием