探究 | Elasticsearch集群规模和容量规划的底层逻辑
0、引言 实战中经常遇到的问题: 问题 1:请问下大家是如何评估集群的规模?比如数据量达到百万,千万,亿万,分别需要什么级别的集群,这要怎么评估? ps:自己搭建的测试环境很难达到这一级别。 问题 2: 问题 3:我看了很多文章关于 es 集群规划的文章,总感觉乱七八糟的,没有一个统一的规划思路。如何根据硬件条件和数据量来规划集群,设置多少节点,每个节点规划多少分片和副本? Elasticsearch 集群规模和容量规划:是进行 Elasticsearch 集群部署前对所需资源类型和数量的规划。 通过本文,您将了解: Elasticsearch 计算资源详解 Elasticsearch 架构、增删改查操作和资源需求 Elasticsearch 集群规模和容量规划的方法论 1、Elasticsearch 基础架构 1.1 自顶向下的架构体系 Cluster—协同工作的节点组,以保障 Elasticsearch 的运行。 Node—运行 Elasticsearch 软件的 Java 进程。 Index—一组形成逻辑数据存储的分片的集合。 Shard—Lucene 索引,用于存储和处理 Elasticsearch 索引的一部分。 Segment—Lucene 段,存储了 Lucene 索引的一部分且不可变。 Document—条记录,用以写入 Elasticsearch