Семантический поиск в Python для хобби + последние новости

Я хочу реализовать семантический поиск на основе python по набору ключевых слов (в основном хобби, последние новости и т. д., о которых людям может быть интересно поговорить). Я хочу знать, существует ли база данных онтологии для тех же алгоритмов/реализаций поиска с открытым исходным кодом для того же самого.

например. Мой набор = {говорить, пить, чирикать, Катрина кайф, Катрина циклон, сбор камней, сбор монет}

Итак, при поиске "аккумулировать" я мог бы получить коллекцию камней и монетка собирая как выход.

изменить : Термины могут иметь несколько слов. Это " президент. Барак Обама из Соединенных Штатов" является действительным запросом.

2 ответов


вы можете использовать "случайное индексирование". Он может делать именно то, что вам нужно, это вычисляет вектор признаков для каждого слова и определяет метрику семантического сходства между двумя словами.

все, что вам нужно, чтобы захватить копию введение в случайную индексацию и semanticvectors пакет, чтобы вы начали ...

Я надеюсь, что это поможет, если вам нужны дальнейшие советы, прокомментируйте ...


Я надеюсь, но не уверен, если это полезно для вас.

Gnowsys

  • все еще под тяжелым развитием