mmseg4j

Solr4:Tomcat7下面配置Solr

我是研究僧i 提交于 2020-02-29 09:31:06
前提是已经在Tomcat7下面配置好Solr4.0,详情参考: Solr4:Tomcat7下面配置Solr 1.下载mmseg4j 下载地址: http://code.google.com/p/mmseg4j/downloads/list ,目前mmseg4j的mmseg4j-1.9.0-SNAPSHOT版本支持Solr4.0,但仍然需要做相关改动。 2.解压mmseg4j-1.9.0.v20120712-SNAPSHOT.zip 用到下面文件: mmseg4j-all-1.9.0.v20120712-SNAPSHOT.jar 放到之前安装 $CATALINA_HOME/webapps/solr/WEB-INF/lib/ 目录下 data 目录,建议拷贝下面内容到 $SOLR_HOME\collection1\conf\mm4jdic 3.设置mmseg4j中文分词 修改 $SOLR_HOME/collection1/conf/schema.xml ,在 <types></types> 中增加如下内容: <fieldType name="textComplex" class="solr.TextField" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode=

mmseg4j分词的使用

左心房为你撑大大i 提交于 2019-12-07 12:03:57
在应用程序中使用 maven坐标: <dependency> <groupId>com.chenlb.mmseg4j</groupId> <artifactId>mmseg4j-core</artifactId> <version>1.10.0</version> </dependency> 默认加载词典的路径代码如下(源码单词拼写有错误,将就着看吧,readonly): 另外,可以建立自己的词库,文件名为words*.dic,并且文件要以UTF-8无BOM格式编码。 * 每个分词文件必须以words开头,.dic结尾,如:words-canmou.dic * 每个分词文件大小必须控制在50M以内,否则很可能会OOM /** * 当 words.dic 是从 jar 里加载时, 可能 defalut 不存在 */ public static File getDefalutPath() { if(defalutPath == null) { String defPath = System.getProperty("mmseg.dic.path"); log.info("look up in mmseg.dic.path="+defPath); if(defPath == null) { URL url = Dictionary.class.getClassLoader()

Solr5.4.0+Tomcat+mmseg4j

孤人 提交于 2019-12-06 05:48:11
solr5.4 mmseg4j-solr-2.3.0 mmseg4j-core-1.10.0 Solr的配置: 1、去 http://www.apache.org/dyn/closer.lua/lucene/solr/5.4.0 下载 solr-5.4.0.tgz,并解压; 2、将/solr/solr-5.4.0/server/solr-webapp/下的webapp文件夹复制到/usr/local/tomcat/tomcat-8.0.30/webapps/目录下,改名为solr; 3、将/usr/local/solr/solr-5.4.0/server/lib/ext/目录下的所有jar包复制到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/目录下; 4、将/usr/local/solr/solr-5.4.0/server/solr目录复制到/usr/local/tomcat/并重命名为solr_home;(存放检索数据的) 5、修改/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/web.xml,找到<env-entry>节点,该结点处于被注释状态,去掉注释,按如下代码修改: <env-entry> <env-entry-name>solr/home<

Solr4.3整合到Tomcat中并添加MMSeg4j中文分词器

生来就可爱ヽ(ⅴ<●) 提交于 2019-12-05 08:39:07
Solr4.3整合到Tomcat中并添加MMSeg4j中文分词器 1、新建一个文件夹命名为Solr并在里面建两个文件夹分别命名为home和server。 2、将下载的Solr包解压进入example的solr文件夹中拷贝其中的内容到刚建的home文件夹中。 3、将example的webapps文件夹中的solr.war包拷贝到刚建的server文件夹中并解压得到。 4、修改Solr\home\collection1\conf目录下的solrconfig.xml文件。 可以看到solr.data.dir指向刚才见的home文件夹中的data文件夹。我们需要在home文件夹中创建一个文件夹命名为data用于存放索引。 5、为Tomcat的Server.xml配置Context,也就是在需要启动Solr应用的Tomcat中的conf目录中的Server.xml配置文件添加Context节点,配置如下: 图中画荧光背景的固定写法。 6、启动Tomcat Solr4.3会报一个错误。如图: 报不能找到SLF4j logging,可以到Sorl解压包的solr-4.3.0\example\lib\ext目录下把里面五个jar文件拷贝到Solr\server\solr\WEB-INF\lib的目录中, 然后重启Tomcat。 7、访问 h tt p://localhost:8080/solr

Solr 5.3.0集成mmseg4j、tomcat部署、Solrj 5.3.0使用

橙三吉。 提交于 2019-12-04 04:10:54
环境:Jdk 1.7 Solr 5.3.0 Tomcat 7 mmseg4j-solr-2.3.0 1、Solr环境搭建 1.解压solr 5.3.0 2.新建solr_home,将解压文件中的 server/solr 文件夹的复制到solr_home 3.配置solr_home。在solr_home/solr中新建应用 mysolr 4.将solr_home/solr/configsets/sample_techproducts_configs中的conf文件夹复制到mysolr中 5.在mysolr目录中新建core.properties内容为name=mysolr (solr中的mysolr应用) 6.以tomcat 7为solr容器,解压tomcat 7.将solr-5.3.0\server中的solr-webapp复制到tomcat的webapps目录,重命名为solr 8.复制文件 (1)将以下内容复制到tomcat/webapps/solr/WEB-INF/lib文件夹中 (2)将log4j.properties复制到tomcat/webapps/solr/WEB-INF/classes文件夹中(新建classes) 9.配置solr项目中的web.xml,打开 env-entry节点,配置solr_home 10.启动tomcat浏览器输入http:/