Апач Нутч и Solr интеграции

Я пытался следовать nutch учебник но есть небольшая проблема со схемой.XML-файл.

мне сказали, что nutch предоставил схему моему проекту, по существу это...

cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/

я развернул файл solr в Tomcat, и ошибка, которую я получаю, когда я иду на панель мониторинга Solr, -

collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException:
Plugin init failure for [schema.xml] fieldType "text": 
Plugin init failure for [schema.xml] analyzer/filter:
Error loading class 'solr.EnglishPorterFilterFactory'

который относится к этому элементу в моем solrconfig.XML-файл (я могу прокомментировать это, но не уверен, насколько это важно пока)

<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>

я отредактировал свой solrconfig.xml, чтобы попытаться включить ряд файлов jar, которые поставляются с solr, в частности

<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" />
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" />

но я не думаю, что они содержат отсутствующий класс "solr.EnglishPorterFilterFactory"

кто-нибудь есть идеи, почему это может не работать или если я что-то пропустил? Я не Разработчик Java btw, поэтому, без сомнения, это будет что-то простое :)

обновление После выяснения того, что схема были некоторые старые классы ссылки я еще раз посмотрел на нутч/conf и ТТ выглядит как ${NUTCH_RUNTIME_HOME}/конф/схемы-solr4.XML-файл, который, кажется, работает.

не 100%, если это правильно, но эй...

1 ответов


выглядит так:EnglishPorterFilterFactory не в 4.х. См. примечание в это 3.6.0 документация:

Deprecated.
  Use SnowballPorterFilterFactory with language="English" instead

много устаревших вещей ушло в 4.0. Я бы сделал то, что он говорит, см. документация для SnowballPorterFilterFactory.