redis脑裂是什么意思?如何预防?如何处理?
reids脑裂分为两种模式:
一、哨兵模式(sentinel)的脑裂
因为网络问题,导致sentinel(哨兵)与master(主节点)通讯中断,当哨兵找不到master的时候,认为master宕机;需要选举一个slave(备份节点)作为主节点。旧master上的客户端连接如果与master未中断,可以继续写入数据;新的master处理新客户端的写操作。这时候两个master数据不一致。当旧的master与哨兵恢复通讯时,旧的master就会降级为slave。新的master将新写入的数据,同步到旧的master中,但是缺少旧的master中写入的数据,所以数据丢失。
二、redis集群模式的脑裂
集群中的多节点通讯出现问题,造成多个集群同时出现,可能有数据丢失问题。(上图是最友好的集群模式的脑裂)
redis脑裂的预防:
设置超时:如 - 链接超时设置为2秒。任何链接只能在2秒内工作。那么哨兵选举新的master,可以延时2秒。
异地多活:提升网络健康状态,保证硬件不出现问题,就不会有链接中断的可能,且万一链接中断,一定是master对外所有链接中断。
redis脑裂的解决方案
1.redis的配置文件中,存在两个参数
min-slaves-to-write 3
min-slaves-max-lag 10
第一个参数表示连接到master的最少slave数量
第二个参数表示slave连接到master的最大延迟时间
如果连接到master的slave数量小于第一个参数,且ping的延迟时间小于等于第二个参数,那么master就会拒绝写请求
配置了这两个参数之后,如果发生集群脑裂,原先的master节点接收到客户端的写入请求会拒绝,就可以减少数据同步之后的数据丢失。
注意:较新版本的redis.conf文件中的参数变成了
min-replicas-to-write 3
min-replicas-max-lag 10
2.设置监控中心,提供预警功能,线下人为处理脑裂后果, 定时扫描,同步数据。
来源:CSDN
作者:Fairy张小高
链接:https://blog.csdn.net/weixin_45579780/article/details/103875814