Elasticsearch:ICU分词器介绍
ICU Analysis插件是一组将Lucene ICU模块集成到Elasticsearch中的库。 本质上,ICU的目的是增加对Unicode和全球化的支持,以提供对亚洲语言更好的文本分割分析。 从Elasticsearch的角度来看,此插件提供了文本分析中的新组件,如下表所示: 安装 我们可以首先到Elasticsearch的安装目录打入如下的命令: $ pwd /Users/liuxg/elastic/elasticsearch-7.3.0 (base) localhost:elasticsearch-7.3.0 liuxg$ ./bin/elasticsearch-plugin list analysis-icu analysis-ik pinyin 上面显示我已经安装好了三个插件。上面的 analysis-ik 及 pinyin 都是为中文而准备的。这在我之前的文章中都有介绍。请详细阅读。 注意 :如果你们在使用上面的elasticsearch-plug list命名出现如下的错误的话: 那么请使用如下的命令来删除在当前目录下的.DS_Store目录: sudo find /Path/to/your/elasticsearch-folder -name ".DS_Store" -depth -exec rm {} \; 然后重新运行上面的命令就不会有问题了。