Интеграция Apache Nutch и Solr
Я попытался выполнить учебник по орехам, но с небольшим количеством проблем с файлом schema.xml.
Мне сказали, чтобы орех предоставил схему моему проекту, в основном это...
cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/
Я развернул свой файл solr в Tomcat, и ошибка, которую я получаю, когда я перехожу на панель инструментов Solr,
collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException:
Plugin init failure for [schema.xml] fieldType "text":
Plugin init failure for [schema.xml] analyzer/filter:
Error loading class 'solr.EnglishPorterFilterFactory'
Что касается этого элемента в моем файле solrconfig.xml(я могу прокомментировать это, но не уверен, насколько это важно)
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>
Я редактировал свой файл solrconfig.xml, чтобы попытаться включить ряд файлов jar, которые поставляются с solr, в частности
<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" />
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" />
Но я не думаю, что они содержат отсутствующий класс "solr.EnglishPorterFilterFactory"
Есть ли у кого-нибудь идеи, почему это может не работать или я что-то пропустил?
Я не разработчик Java, поэтому не сомневаюсь, что это будет что-то простое:)
UPDATE
Узнав, что на схеме были ссылки на некоторые старые классы, я еще раз посмотрел в nutch/conf и tt, похоже, есть файл ${NUTCH_RUNTIME_HOME}/conf/schema-solr4.xml, который, похоже, работает.
Не 100%, если это правильно, но эй...
Ответы
Ответ 1
Похоже, EnglishPorterFilterFactory
больше нет в 4.x. См. Примечание в это документация 3.6.0:
Deprecated.
Use SnowballPorterFilterFactory with language="English" instead
Много устаревших вещей ушло в 4.0. Я бы сделал то, что он сказал, см. Документацию для SnowballPorterFilterFactory.