IKAnalyzer中文分词器,兼容solr6.6.0,优化英文数字细粒度搜索
IKAnalyzer2017_6_6_0 码云: https://git.oschina.net/iicode/IKAnalyzer2017_6_6_0 Github: https://github.com/ittalks/IKAnalyzer2017_6_6_0 IKAnalyzer2017_6_6_0.jar下载: https://github.com/ittalks/IKAnalyzer2017_6_6_0/releases/download/v1.0.0/IKAnalyzer2017_6_6_0.jar Solr作为搜索应用服务器,我们在使用过程中,不可避免的要使用中文搜索。 以下介绍solr的 第三方分词器IKAnalyzer 。 注:下面操作在Linux下执行,所添加的配置在windonws下依然有效。 运行环境 Solr:6.6.0 ϵͳ : Linux 以下是设置solr中文分词器的方法。 注:开始之前,假定你已经成功登录solr的界面,并创建了core。 新特性 在使用 IKAnalyzer 分词器之前,先说明由于作者在12年之后没有更新,导致旧版本的分词器和新版本的solr6.6.0无法匹配。 因此在源码的基础上做些改动,以兼容新版的solr。 兼容新版的solr6.6.0; 英文和数据支持单字分词; IK中文分词对于数字和英文的分词方式是: