Solr5.4.0+Tomcat+mmseg4j

孤人 提交于 2019-12-06 05:48:11

solr5.4    mmseg4j-solr-2.3.0    mmseg4j-core-1.10.0

Solr的配置:

1、去http://www.apache.org/dyn/closer.lua/lucene/solr/5.4.0下载 solr-5.4.0.tgz,并解压;

2、将/solr/solr-5.4.0/server/solr-webapp/下的webapp文件夹复制到/usr/local/tomcat/tomcat-8.0.30/webapps/目录下,改名为solr;

3、将/usr/local/solr/solr-5.4.0/server/lib/ext/目录下的所有jar包复制到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/目录下;

4、将/usr/local/solr/solr-5.4.0/server/solr目录复制到/usr/local/tomcat/并重命名为solr_home;(存放检索数据的)

5、修改/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/web.xml,找到<env-entry>节点,该结点处于被注释状态,去掉注释,按如下代码修改:

<env-entry>
    <env-entry-name>solr/home</env-entry-name>
    <env-entry-value>/usr/local/tomcat/solr_home</env-entry-value>
    <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

6、将/usr/local/solr/solr-5.4.0/server/resources/目录下的log4j.properties放到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/classes/目录下,如果classes文件夹不存在就手动新建一个;

7、还需要添加solr-dataimporthandler-5.3.0.jar和solr-dataimporthandler-extras-5.3.0.jar这2个jar包到目录/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/下,否则会报错,这2个包默认不在webapp里,在下载包的dist目录下;

8、重新启动Tomcat服务;

9、访问:localhsot:8080/solr/index.html 可以看到Solr的控制台;

10、添加mysolr

在/usr/local/tomcat/solr_home/目录下创建mysolr(可自定义),在mysolr目录下创建data目录,
并将 /usr/local/tomcat/solr_home/configsets/basic_configs/目录下的conf目录复制到mysolr下;

在mysolr目录中新建core.properties内容为name=mysolr   (solr中的mysolr应用)

通过控制台添加mysolr,并重新启动Tomcat,就会看到新建的mysolr.

二、配置中文分词器(mmseg4j)

mmseg4j-solr-2.3.0

1.将两个jar包考入tomcat中solr项目里的lib文件内

 
2.配置solr_home中mysolr\conf\schema.xml     
    添加:       

 <fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100"> 
      <analyzer> 
         <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
      </analyzer> 
 </fieldtype> 
 
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100"> 
     <analyzer> 
         tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" /> 
     </analyzer> 
</fieldtype> 
 
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100"> 
     <analyzer> 
         <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple"                                 dicPath="n:/custom/path/to/my_dic" /> 
     </analyzer> 
</fieldtype>

修改solr_home中mysolr域的schema.xml,新增要用到mmseg4j分词索引的字段 content_test  分词器选择定义好的textMaxWord

<field name="content_test" type="textMaxWord" indexed="true" stored="true" multiValued="true"/> 

重启tomcat。 

已配好的tomcat链接:http://pan.baidu.com/s/1gf9HHoJ 密码:sn6p

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!