sorl的使用
Sorl定义: sorl是独立的企业级搜索服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的xml文件,生成索引。 同时也可以通过Http Get操作提出查询请求,并以xml返回查询结果 特点: sorl采用java5开发的基于Lucene的全文服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的 全文搜索引擎 。 工作方式: 文档通过Http利用XML 加到一个搜索集合中。 查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能, 垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置 文本分析 ,提供基于Web的管理界面等。 全文检索引擎Solr系列—–全文检索基本原理 http://www.importnew.com/12707.html 全文检索可以归纳为两个过程:1、索引创建(indexing)2、搜索索引(search) Solr/Lucene采用的是一种反向索引,所谓 反向索引 :就是从关键字到文档的映射过程,保存这种映射这种信息的索引称为反向索引 索引创建: 1)把原始文档交给分词组件