背景
假设现在有三台机器,分别安装了redis服务,结构如图
故障发生:如果此时master服务器所在区域网络通信出现异常,导致和两台slave机器无法正常通信,但是和客户端的连接是正常的。那么sentinel就会从两台slave机器中选举其中一个作为新的master来处理客户端请求。如图
这个时候,已经存在两台master服务器,client发送的数据会持续保存在旧的master服务器中,而新的master和slave中没有新的数据。如果一分钟以后,网络恢复正常,服务之间能够正常通信。此时,sentinel会把旧的master会变成新的master的slave节点。如图
问题出现了,我们都知道,slave会从master中同步数据,保持主从数据一致。这个时候,变成了slave节点的旧master会丢失掉通信异常期间从客户端接收到的数据。
解决方案
在配置文件中添加如下配置
min-slaves-to-write 1
min-slaves-max-lag 10
这两个配置什么意思呢?
min-slaves-to-write 1,要求至少有一个slave。
min-slaves-max-lag 10,主从数据同步超时时间,10秒。
以上两个配置,都不满足就会导致master拒绝接受客户端请求。根据以上配置可以将master通信异常期间的数据丢失控制在10秒以内