在 Redis 复制的基础上,使用和配置主从复制非常简单,能使得从 Redis 从服务器(下文称 slave)能精确得复制主 Redis 服务器(下文称 master)的内容。每次当 slave 和 master 之间的连接断开时, slave 会自动重连到 master 上,并且无论这期间 master 发生了什么, slave 都将尝试让自身成为 master 的精确副本。
主从复制,是指将一台 Redis 服务器的数据,复制到其他的 Redis 服务器。前者称为主节点(Master),后者称为从节点(Slave);数据的复制是单向的,只能由主节点到从节点。
默认情况下,每台 Redis 服务器都是主节点;且一个主节点可以有多个从节点 (或没有从节点),但一个从节点只能有一个主节点。
数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务 (即写 Redis 数据时应用连接主节点,读 Redis 数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
1.若启动一个Slave机器进程,则它会向Master机器发送一个“sync command" 命令,请求同步连接。
2.无论是第一次连接还是重新连接,Master机器 都会启动一个后台进程,将数据快照保存到数据文件中(执行rdb操作) ,同时 Master 还会记录修改数据的所有命令并缓存在数据文件中。
3.后台进程完成缓存操作之后,Master 机器就会向 Slave 机器发送数据文件,Slave 端机器将数据文件保存到硬盘上,然后将其加载到内存中,接着 Master 机器就会将修改数据的所有操作一并发送给 Slave 端机器。若 Slave 出现故障导致宕机,则恢复正常后会自动重新连接。
4.Master机器收到 Slave 端机器的连接后,将其完整的数据文件发送给 Slave 端机器,如果 Mater 同时收到多个 Slave 发来的同步请求,则 Master 会在后台启动一个进程以保存数据文件,然后将其发送给所有的 Slave 端机器,确保所有的 Slave 端机器都正常
环境准备
服务器类型 | IP | Redis版本 |
---|---|---|
Master | 192.168.80.20 | redis-5.0.7 |
slaver1 | 192.168.80.25 | redis-5.0.7 |
slaver2 | 192.168.80.30 | redis-5.0.7 |
redis的安装步骤可参考
Redis基础 - 残-云 - 博客园 (cnblogs.com)
1.关闭防火墙
systemctl stop firewalld systemctl disable firewalld setenforce 0
2.修改Master配置文件
-----------修改Redis 配置文件(Master节点操作) ---------- vim /etc/redis/6379.conf bind 0.0.0.0 #70行,注释掉bind项,或修改为0.0.0.0,默认监听所有网卡 daemonize yes #137行,开启守护进程 logfile /var/log/redis_6379.log #172行,指定日志文件目录 dir /var/lib/redis/6379 #264行,指定工作目录 appendonly yes #700行,开启AOF持久化功能 /etc/init.d/redis_6379 restart
3.修改slaver1、slaver2配置
![image-20220617144810942](https://www.www.weizhi.cc/i/l/?n=22&i=blog/2751572/202206/2751572-20220617172345188-1638570210.png)-----------修改Redis 配置文件(Slave节点操作)------------ vim /etc/redis/6379.conf bind 0.0.0.0 #70行,修改监听地址为0.0.0.0![image-20220617144810942](https://www.www.weizhi.cc/i/l/?n=22&i=blog/2751572/202206/2751572-20220617172345188-1638570210.png)
1.主配置文件修改
2.slaver1、slaver2从节点配置
3.验证主从效果
主查看日志
redis内查看
主插入一条数据
哨兵的核心功能:在主从复制的基础上,哨兵引入了主节点的自动故障转移。
Redis 的哨兵系统用于管理多个 Redis 服务器(instance), 该系统执行以下三个任务:
哨兵结构由两部分组成:哨兵节点和数据节点。
哨兵的启动依赖于主从模式,所以须把主从模式安装好的情况下再去做哨兵模式,所有节点上都需要部署哨兵模式,哨兵模式会监控所有的Redis 工作节点是否正常,当Master 出现问题的时候,因为其他节点与主节点失去联系,因此会投票,投票过半就认为这个 Master 的确出现问题,然后会通知哨兵间,然后从Slaves中选取一个作为新的 Master。
需要特别注意的是:客观下线是主节点才有的概念;如果从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观下线和故障转移操作。
1.所有节点修改哨兵模式配置文件
--------修改Redis哨兵模式的配置文件(所有节点操作) -------- vim /opt/redis-5.0.7/sentinel.conf protected-mode no #17行,关闭保护模式 port 26379 #21行,Redis哨兵默认的监听端口 daemonize yes #26行,指定sentinel为后台启动 logfile "/var/log/sentinel.log" #36行,指定日志存放路径 dir "/var/lib/redis/6379" #65行,指定数据库存放路径 sentinel monitor mymaster 192.168.80.20 6379 2 #84行, 修改 指定该哨兵节点监控192.168.80.20:6379这个主节点,该主节点的名称是mymaster,最后的2的含义与主节点的故障判定有关:至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移 sentinel down-after-milliseconds mymaster 30000 #113行,判定服务器down掉的时间周期,默认30000毫秒(30秒) sentinel failover-timeout mymaster 180000 #146行,故障节点的最大超时时间为180000 (180秒 )
2.启动哨兵模式
----------启动哨兵模式----------------- 注意:先启master,再启slave cd /opt/redis-5.0.7/ redis-sentinel sentinel.conf &
3.查看哨兵信息
-----------查看哨兵信息------------------ redis-cli -p 26379 info Sentinel # Sentinel sentinel_masters:1 sentinel_tilt:0 sentinel_running_scripts:0 sentinel_scripts_queue_length:0 sentinel_simulate_failure_flags:0 master0:name=mymaster,status=ok,address=192.168.80.20:6379,slaves=2,sentinels=3
故障模拟:
关闭主的redis服务,模拟服务宕机
查看节点是否切换
原主上查看日志
在现存的两个节点查看哨兵状态
Redis 集群是 Redis 的一个分布式实现,主要是为了实现以下这些目标(按在设计中的重要性排序):
Redis 集群没有使用一致性hash, 而是引入了 哈希槽的概念.
Redis 集群有16384个哈希槽,每个key通过CRC16校验后对16384取模来决定放置哪个槽.集群的每个节点负责一部分hash槽,举个例子,比如当前集群有3个节点,那么:
这种结构很容易添加或者删除节点. 比如如果我想新添加个节点D, 我需要从节点 A, B, C中得部分槽到D上. 如果我想移除节点A,需要将A中的槽移到B和C节点上,然后将没有任何槽的A节点从集群中移除即可. 由于从一个节点将哈希槽移动到另一个节点并不会停止服务,所以无论添加删除或者改变某个节点的哈希槽的数量都不会造成集群不可用的状态。
为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型,每个节点都会有N-1个复制品.
在我们例子中具有A,B,C三个节点的集群,在没有复制模型的情况下,如果节点B失败了,那么整个集群就会以为缺少5501-11000这个范围的槽而不可用.
然而如果在集群创建的时候(或者过一段时间)我们为每个节点添加一个从节点A1,B1,C1,那么整个集群便有三个master节点和三个slave节点组成,这样在节点B失败后,集群便会选举B1为新的主节点继续服务,整个集群便不会因为槽找不到而不可用了
不过当B和B1 都失败后,集群是不可用的.
Redis 并不能保证数据的强一致性. 这意味这在实际中集群在特定的条件下可能会丢失写操作.
第一个原因是因为集群是用了异步复制. 写操作过程:
主节点对命令的复制工作发生在返回命令回复之后, 因为如果每次处理命令请求都需要等待复制操作完成的话, 那么主节点处理命令请求的速度将极大地降低 —— 我们必须在性能和一致性之间做出权衡。 注意:Redis 集群可能会在将来提供同步写的方法。 Redis 集群另外一种可能会丢失命令的情况是集群出现了网络分区, 并且一个客户端与至少包括一个主节点在内的少数实例被孤立。
举个例子 假设集群包含 A 、 B 、 C 、 A1 、 B1 、 C1 六个节点, 其中 A 、B 、C 为主节点, A1 、B1 、C1 为A,B,C的从节点, 还有一个客户端 Z1 假设集群中发生网络分区,那么集群可能会分为两方,大部分的一方包含节点 A 、C 、A1 、B1 和 C1 ,小部分的一方则包含节点 B 和客户端 Z1 .
Z1仍然能够向主节点B中写入, 如果网络分区发生时间较短,那么集群将会继续正常运作,如果分区的时间足够让大部分的一方将B1选举为新的master,那么Z1写入B中得数据便丢失了.
注意, 在网络分裂出现期间, 客户端 Z1 可以向主节点 B 发送写命令的最大时间是有限制的, 这一时间限制称为节点超时时间(node timeout), 是 Redis 集群的一个重要的配置选项:
REDIS cluster-tutorial -- Redis中文资料站 -- Redis中国用户组(CRUG)
环境准备
服务类型 | IP地址 | Redis版本 |
---|---|---|
Master1 | 192.168.80.20 | redis-5.0.7 |
Master2 | 192.168.80.25 | redis-5.0.7 |
Master3 | 192.168.80.30 | redis-5.0.7 |
slaver1 | 192.168.80.35 | redis-5.0.7 |
slaver2 | 192.168.80.40 | redis-5.0.7 |
slaver3 | 192.168.80.45 | redis-5.0.7 |
1.配置文件修改
cd /etc/redis vim 6379.conf #bind 127.0.0.1 #70行,注释掉bind项,默认监听所有网卡 protected-mode no #89行,修改,关闭保护模式 port 6001 #93行,修改,redis监听端口 daemonize yes #137行,开启守护进程,以独立进程启动 appendonly yes #700行,修改,开启AOF持久化 cluster-enabled yes #833行,取消注释,开启群集功能 cluster-config-file nodes-6001.conf #841行,取消注释,群集名称文件设置 cluster-node-timeout 15000 #847行,取消注释群集超时时间设置
2.集群节点启动
/etc/init.d/redis_6379 restart
3.启动集群
#启动集群 redis-cli --cluster create 192.168.80.20:6001 192.168.80.25:6001 192.168.80.30:6001 192.168.80.35:6001 192.168.80.40:6001 192.168.80.45:6001 --cluster-replicas 1 #六个实例分为三组,每组一主一从,前面的做主节点,后面的做从节点。下面交互的时候需要输入yes 才可以创建。 -replicas 1 #表示每个主节点有1个从节点。
4.测试集群
#测试群集 redis-cli -p 6001 -c #加-c参数,节点之间就可以互相跳转 127.0.0.1:6001> cluster slots #查看节点的哈希槽编号范围 1) 1) (integer) 5461 2) (integer) 10922 #哈希槽编号范围 3) 1) "127.0.0.1" . 2) (integer) 6003 #主节点IP和端口号 3) " fdca661922216dd69a 63a7c9d3c4540cd6baef44" 4) 1) "127.0.0.1" 2) (integer) 6004 #从节点IP和端口号 3) "a2c0c32aff0f38980accd2b63d6d952812e44740" 2) 1) (integer) 0 2) (integer) 5460 3) 1) "127.0.0.1" 2) (integer) 6001 3) "0e5873747a2e2 6bdc935bc76c2ba fb19d0a54b11" 4) 1) "127.0.0.1" 2) (integer) 6006 3) "8842ef5584a85005e135fd0ee59e5a0d67b0cf8e" 3) 1) (integer) 10923 2) (integer) 16383 3) 1) "127.0.0.1" 2) (integer) 6002 3) "81 6ddaa3d14 69540b2f fbcaaf9aa867646846b30" 4) 1) "127.0.0.1" 2) (integer) 6005 3) "f847077bfe6722466e96178ae8cbb09dc8b4d5eb" 127.0.0.1:6001> set name zhangsan -> Redirected to slot [5798] located at 127.0.0.1: 6003 OK 127.0.0.1:6001> cluster keyslot name #查看name键的槽编号 (integer) 5798
4.测试群集