Семантический анализ с использованием Solr

Я рассматриваю возможность добавления семантического анализа в мою установку Solr, но я точно не знаю, с чего начать.

в принципе, я хотел бы, чтобы Solr мог найти "похожие" слова (взятые из тела индексированных документов). Например, если я ищу "музыку", я должен иметь возможность запросить семантический движок и получить" рок"," поп " и т. д. (конечно, если эти слова появились рядом с музыкой в некоторых индексированных документах).

Я нашел этот проект, но я не знаю, правильное ли это место для начала.: http://code.google.com/p/semanticvectors/

2 ответов


можно использовать Lucene Wordnet contrib package искать синонимы.

оптимизация поиска в Lucene и Solr дает другие способы расширения запросов.


семантическое индексирование-хорошее место для начала. Однако, по моему опыту, на практике такие технологии работают не так хорошо. Вы часто заканчиваете с очень странными результатами. Кроме того, из - за Google у людей есть определенное ожидание того, как должен вести себя поиск по ключевым словам-Т. е. ваш поисковый термин должен появиться в соответствующем документе.