ElasticSearch

ElasticSearch搜索引擎入门基础(详细步骤)

我的未来我决定 提交于 2020-10-24 18:39:27
ElasticSearch 概述: 学习,从百度开始。 以下是Elasticsearch百度百科的介绍,如果已经了解,可以跳过。 ​ Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。 ​ Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr,也是基于Lucene。 ​ Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性,能使数据在生产环境变得更有价值。 ​ Elasticsearch 的实现原理主要分为以下几个步骤,首先用户将数据提交到Elasticsearch 数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候

ElasticSearch分页方案【靠谱】

天涯浪子 提交于 2020-10-24 12:59:03
1:from + size 浅分页 "浅"分页是最简单的分页方案。es会根据查询条件在每一个DataNode分片中取出from+size条文档,然后在MasterNode中聚合、排序,再截取size-from的文档返回给调用方。当页数越靠后,也就是from+size越大,es需要读取的数据也就是越大,聚合和排序的时候处理的数据量也越大,此时会加大服务器CPU和内存的消耗。 GET test_dev/_search { "query": { "bool": { "filter": [ { "term": { "age": 28 } } ] } }, "size": 10, "from": 20, "sort": [ { "timestamp": { "order": "desc" }, "_id": { "order": "desc" } } ] } 其中,from定义了目标数据的偏移值,size定义当前返回的数目。默认from为0,size为10,即所有的查询默认仅仅返回前10条数据。 在这里有必要了解一下from/size的原理: 因为es是基于分片的,假设有5个分片,from=100,size=10。则会根据排序规则从5个分片中各取回100条数据数据,然后汇总成500条数据后选择最后面的10条数据。 做过测试,越往后的分页,执行的效率越低。总体上会随着from的增加

如何在Ubuntu Server 20.04上安装Graylog系统日志管理器

时光总嘲笑我的痴心妄想 提交于 2020-10-24 00:58:38
您可能在您的数据中心有几台Ubuntu服务器在运行。这些系统的安全性如何?您最近检查过日志吗?这些日志文件包含了关于您系统安全的重要信息。梳理这些大量的日志文件可能是一件苦差事--尤其是当您必须检查整个网络中每个系统的日志文件时。 好在有Graylog这样的工具可用。Graylog是一个开源的日志管理平台,用于监控网络相关系统的日志。Graylog使用MongDB来存储信息,所以它完全可以根据你的需求进行扩展。 Graylog可以帮助你收集、整理、分析和提取数据。掌握了这些信息,你就可以更好地保护服务器的安全和优化。 让我们在Ubuntu Server 20.04上安装Graylog。 准备工作 Ubuntu Server 20.04的实例 具有sudo特权的用户 1、如何更新和升级Ubuntu 我们必须做的第一件事是更新和升级服务器。 注意:如果内核已升级,则需要重新引导才能使更改生效。因此,请确保在可行的重新引导时运行更新/升级。 要更新和升级Ubuntu,请登录到服务器并发出以下两个命令: sudo apt-get update sudo apt-get upgrade -y 2、如何安装Java 接下来,我们需要安装第一个依赖项Java。为此,发出以下命令: sudo apt-get install openjdk-11-jre-headless -y 3