Семантический поиск в Python для хобби + последние новости
Я хочу реализовать семантический поиск на основе python по набору ключевых слов (в основном хобби, последние новости и т. д., о которых людям может быть интересно поговорить). Я хочу знать, существует ли база данных онтологии для тех же алгоритмов/реализаций поиска с открытым исходным кодом для того же самого.
например. Мой набор = {говорить, пить, чирикать, Катрина кайф, Катрина циклон, сбор камней, сбор монет}
Итак, при поиске "аккумулировать" я мог бы получить коллекцию камней и монетка собирая как выход.
изменить : Термины могут иметь несколько слов. Это " президент. Барак Обама из Соединенных Штатов" является действительным запросом.
2 ответов
вы можете использовать "случайное индексирование". Он может делать именно то, что вам нужно, это вычисляет вектор признаков для каждого слова и определяет метрику семантического сходства между двумя словами.
все, что вам нужно, чтобы захватить копию введение в случайную индексацию и semanticvectors пакет, чтобы вы начали ...
Я надеюсь, что это поможет, если вам нужны дальнейшие советы, прокомментируйте ...