ElasticSearch安装中文分词器

拈花ヽ惹草 提交于 2019-11-28 16:10:42
  1. 下载并安装ik分词插件。 ik分词官网: https://github.com/medcl/elasticsearch-analysis-ik
方式一:
./elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.2.0/elasticsearch-analysis-ik-7.2.0.zip

方式二:
a. 在plugins目录下创建目录ik, 并把上述的zip压缩包里的内容解压到ik目录中。
b. 更改ik目录的所有者为ElasticSearch的启动账号
chown -R es ./ik/
c. 修改ik分词器下面的plugin-descriptor.properties文件
vim ./plugin-descriptor.properties
将其中的
elasticsearch.version=7.2.0
改成ElasticSearch的版本, 如
elasticsearch.version=7.2.1

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  1. 重启ElasticSearch

  2. IK分词器提供了两种analyzer,分别是ik_max_word和ik_smart

ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,国,国歌”,会穷尽各种可能的组合。
ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。

  1. 测试IK分词器
GET _analyze
{
  "text" : "中华人民共和国国歌",
  "analyzer": "ik_max_word"
}

GET _analyze
{
“text” : “中华人民共和国国歌”,
“analyzer”: “ik_smart”
}

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
                                </div>
  1. 下载并安装ik分词插件。 ik分词官网: https://github.com/medcl/elasticsearch-analysis-ik
方式一:
./elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.2.0/elasticsearch-analysis-ik-7.2.0.zip
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!