1、集群状态查看 通过这两个界面可以看出 1.1如果heap红色,会导致界面查询比较慢. 通常是打开了比较多的索引, 可以在企业版的日志策略中打开自动关闭索 引的功能, 通常是打开7天的索引, 可以根据具体内存情况多打开几天,比如10天或者15天, 不能太多. 1.2.如果cpu和load红色, 会导致界面查询慢, 写入也慢, 对采集器的影响尤其明显, 采集器的日志中会出现超时或者bulk reject错误. 可能原因如下: a)当天或当前正在大量写入的event索引的分片分布不均,某个节点上分布了比较多的分片,导致该节点压力很大 b)磁盘写入速度太低 c)分片在恢复或者rebalance d)cpu核数少 e)主机上同时部署了其他消耗cpu资源较多的应用 1.3.如果磁盘使用率达到85%可能导致, 索引分片不能分配到此节点, 导致其他节点压力变大, 集群性能下降 1.4.可以看出节点列表是否缺少节点, 如果少节点, 可能存在下面两种情况: a)节点进程死掉, 没启动成功 b)集群发生脑裂, 一个大集群变成了多个小集群 5.节点列表里面实心星号的节点是当前的master节点, 需要看ES日志时首先看此节点的日志, 不能发现问题再看其他节点的日志. 2、查看集群参数配置 curl http://localhost:9200/_cluster/settings?pretty