搜索框架:lucene,Solr,Elastic Search 了解一下

耗尽温柔 提交于 2020-04-05 17:56:16

下一篇:Elasticsearch 入门安装

1、lucene (了解)

apache 项目基金会的一个顶级项目(主要用于搜索)

1.2、什么是 Lucene

lucene 是一个开源的搜索架构,它的作者就是当前hadoop(大数据)的作者

Lucene core: 基于 Java 开发,包含了搜索库,包含了搜索索引,包含了关键字的高亮显示/分词器 ...

Solr: 借助于 lucene 进行开发的,就是使用lucene core 进行构建和开发的,并且提供了 json,py,ruby,java 各种API

PyLucene: 其实也支持 python

无论是ES还是Solr都是基于Lucene进行开发的

2、Solr (了解)

一个搜索框架,支持分布式,solr 是构建在 Lucene 之上的,所支持格式 json,xml,csv . . .

3、ElasticSearch

ES是一个分布式使用 RestFul 风格的数据搜索引擎,也是构建在 Lucene 之上的,且数据储存格式只支持 JSON 格式。

3.1、ES 的三大核心

Index: 相当于关系型数据库中的库

Type: 相当于关系型数据库中的表

Document: 相当于关系型数据库中的表数据

3.2、ES 和 Solr 的区别

  • 1、ES 下载以后直接可以使用;Solr 配置比较复杂

  • 2、Solr 使用 zookeeper 进行分布式的管理;ES 自身就带有分布式协调功能。

    zookeeper(3台)+Solr(2台)ES(2台)

  • 3、Solr 所支持的格式比较多(json,xml,csv . . .);ES只支持JSON数据格式。

  • 4、在 Solr 中的功能比较多,但是 ES 讲究职责单一化原则(更注重于搜索的核心功能)

    1、如果在ES上需要做一些拓展,高级特性需要第三方插件

    2、Solr自带的就有可视化界面,ES只能借助kibana做可视化支持

  • 5、Solr 查询效率快,但是索引更新的慢(查询,删除比较慢),适用于大型

    ​ 的传统查询

    • 淘宝:在项目运行之前,需要维护大量的商品数据(insert),这些数据用户不需要知道,也不需要特别高的效率,但是当用户进行查询的时候就必须要求效率

    ​ ES建立索引非常快,可以用于实时性的查询(Facebook)

    Solr一般情况下适用于传统的搜索应用,ES更实用于目前比较新兴的实时搜索应用

  • 6、Solr 比较成熟,客户量大 ;ES相比较客户量小,更新快,学习成本比 solr 更高一些

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!