原文链接:CDCN-码上中国
Lucene 是一个基于Java的全文搜索引擎。Lucene不是要给完整的应用程序,而是 一个可以轻松地向应用程序添加搜索功能的代码库API接口。
这是Apache Lucene 6.2.1的官方文档。 Wiki中提供了其他文档。
入门
以下部分旨在作为“入门”指南。 它有三个应用群体:第一,用户希望在他们的应用程序中安装Apache Lucene; 第二,开发人员寻求修改或基于Lucene来开发他们的应用程序; 希望成为开发人员,参与并促进Lucene的发展。 我们的目标是帮助你“上手”。 而不会设计一些非常深入的Lucene概念或内部细节:
-
Lucene演示,其用法和来源: 在Lucene 示例中,通过命令行来达到教程和演示的效果 。
-
介绍Lucene的API的:不同的Lucene包的高度概括。
-
分析概述:简介和分析Lucene的 API。 另请参阅TokenStream使用流程。
参考文献
-
变化:列出了在这个版本中的变更的地方。
-
系统要求:最低的Java版本和支持的Java版本。
-
迁移指南:Lucene 6中有什么变化; 如何从Lucene 5.x迁移代码。
-
JRE版本迁移:有关在主要JRE版本之间升级的信息。
-
文件格式:Lucene支持使用的索引格式指南。 这可以通过使用备用编解码器来定制。
-
Lucene中的搜索和评分:Lucene评分文档简介。
-
经典得分公式:Lucene经典的矢量空间实现公式。 (看这里的其他方式)
-
Classic QueryParser语法:经典QueryParser的语法和功能概述。
Java API 说明文档
-
核心:Lucene核心库
-
分析器 - 通用:用于对不同语言和域中的内容编制索引的分析器。
-
analyser-icu:与ICU(Unicode的国际组件)的分析集成。
-
分析仪:日本形态分析仪
-
analyzer-morfologik:词典词干分析器,内置波兰词典
-
分析器 - 语音:用于索引语音签名的分析器(用于声音相似的搜索)
-
analyzer-smartcn:用于索引中文的分析器
-
分析仪器:波兰分析仪
-
analyzeers-uima:与Apache UIMA的分析集成
-
backward-codecs:用于较早版本Lucene的编解码器。
-
benchmark:Lucene的基准测试系统
-
分类:Lucene的分类模块
-
编解码器:Lucene编解码器和发送格式。
-
demo:简单的示例代码
-
表达式:基于可插入语法对动态计算的值进行排序/切面/搜索。
-
facet:切面索引和搜索功能
-
grouping:用于对搜索结果进行分组的收集器。
-
荧光笔:突出显示搜索结果中的关键字
-
join:归一化内容的索引时间和查询时间联接
-
memory:单文档内存索引实现
-
misc:索引工具和其他杂项代码
-
查询:添加到核心Lucene的过滤器和查询
-
queryparser:查询解析器和解析框架
-
replicator:文件复制实用程序
-
沙箱:各种第三方贡献和新想法
-
空间:地理空间搜索
-
spatial3d:3D空间平面几何API
-
空间额外:地理空间搜索
-
建议:自动建议和拼写检查支持
-
test-framework:测试基于Lucene的应用程序的框架
请尊重本文作者的权利,转载本文请注明本文原文链接
下篇将会翻译Lucene demo演示
来源:oschina
链接:https://my.oschina.net/u/2303434/blog/782302