Redis教程

redis高可用之主从复制,哨兵,集群

本文主要是介绍redis高可用之主从复制,哨兵,集群,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

redis 高可用:主从复制,哨兵,cluster 集群

目录
  • 一:redis 的主从复制
    • 1.1 redis高可用分类
    • 1.2 redis 的主从复制
    • 1.3主从复制的作用
    • 1.4主从复制的流程
  • 二 : 搭建redis主从复制
    • 2.1 安装redis
    • 2.2修改配置master节点redis配置文件
    • 2.3 修改slave 节点的 redis 配置文件
    • 2.4验证主从
      • 在Master节点上查看日志
      • 在Master 节点上验证从节点
  • 三 redis哨兵模式
    • 3.1 redis哨兵的原理
    • 3.2 redis哨兵的作用
    • 3.3 哨兵的组成
    • 3.4故障转移机制
    • 3.5 哨兵的主节点选举
  • 四:搭建redis哨兵模式
    • 4.1 服务器分配
    • 4.2所有哨兵节点修改配置文件
    • 4.3 启动哨兵模式,查看哨兵信息
      • 启动哨兵模式
      • 查看哨兵信息
    • 4.4 故障模拟
      • 查看redis-server的进程号
      • 结束Master 节点上的redis-server进程
      • 验证结果
  • 五:redis的cluster集群模式
    • 5.1 集群的作用
    • 5.2 redis集群的数据分片
  • 六: 搭建redis集群模式
    • 6.1配置redis多实例
    • 6.2修改配置文件,开启集群功能
    • 6.3 启动redis节点
    • 6.4启动集群
    • 6.5 验证集群
      • 启动集群模式连接数据库,查看哈希槽
      • 连接主库,写入数据
      • 集群中查看键值,获取键的哈希值
      • 在从节点查看

一:redis 的主从复制

1.1 redis高可用分类

  • 主从复制:主从复制时高可用redis 的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复
    • 缺陷是故障恢复无法自动化,写操作无法负载均衡;存储能力受到单机的限制。

  • 哨兵:在主从复制的基础上,哨兵实现了自动化的故障恢复。
    • 缺陷:写操作无法负载均衡;存储能力受到单机的限制;哨兵无法对从节点进行自动故障转移,在读写分离场景下,从节点故障会导致读服务不可用,需要对从节点做额外的监控,切换操作

  • 集群:通过集群,redis解决了写操作无法负载均衡,以及存储能哪里受到单机限制的问题,实现了较为完善的高可用方案。


1.2 redis 的主从复制

主从复制,是指将一台redis服务器的数据,复制到其他redis服务器。前者称为主节点(master),后者称为从节点(slave);数据的复制时单项的,只能由主节点到从节点。

默认情况下,每台redis服务器都是主节点;且一个主节点可以有多个从节点(或者没有从节点),但是一个从节点只能由一个主节点



1.3主从复制的作用

  • 数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。

  • 故障恢复:当主节点出现问题是,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余

  • 负载均衡:当主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写redis数据时应用连接上主节点,读redis数据时,应用连接上从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担负载,可以大大提高redis服务器的并发量。

  • 高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制时redis高可用的基础。


1.4主从复制的流程

  1. 若启动一个Slave机器进程,则它会向Master机器发送一个"sync command"命令,请求同步连接。

  2. 无论是第一次连接还是重新连接, Master机器都会启动一个后台进程,将数据快照保存到数据文件中(执行rdb操作) ,同时Master还会记录修改数据的所有命令并缓存在数据文件中。

  3. 后台进程完成缓存操作之后, Master机器就会向Slave机器发送数据文件, Slave端机器将数据文件保存到硬盘上,然后将其加载到内存中,接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若Slave出现故障导致宕机,则恢复正常后会自动重新连接。

  4. Master机器收到Slave端机器的连接后,将其完整的数据文件发送给Slave端机器,如果Mater同时收到多个slave发来的同步请求,则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的Slave端机器,确保所有的Slave端机器都正常。

img



二 : 搭建redis主从复制

2.1 安装redis

systemctl stop firewalld
setenforce 0
yum -y install gcc gcc-c++ make
cd /opt/
tar xf redis-5.0.7.tar.gz  -C /opt/
cd redis-5.0.7/
make && make PREFIX=/usr/local/redis install
cd /opt/redis-5.0.7/utils/

./install_server.sh
......
#填上执行文件路径。
Please select the redis executable path [] /usr/local/redis/bin/redis-serve


ln -s /usr/local/redis/bin/* /usr/local/bin/


2.2修改配置master节点redis配置文件

host103:192.168.23.103

[root@host103 ~]# vim /etc/redis/6379.conf 
#70行,修改监听地址为0.0.0.0,监听所有ip
70// bind 0.0.0.0

#137行,开启守护进程,默认开启
137// daemonize yes

#172行,指定日志文件目录,默认即可
172// logfile /var/log/redis_6379.log

#264行,指定工作目录,默认即可
264// dir /var/lib/redis/6379

#700行,开启AOF持久化功能
700// appendonly yes

:wq


#重启redis服务
[root@host103 ~]# /etc/init.d/redis_6379 restart


[root@host103 ~]# netstat  -natp | grep redis
tcp        0      0 0.0.0.0:6379            0.0.0.0:*               LISTEN      8041/redis-server 0 





2.3 修改slave 节点的 redis 配置文件

host13:192.168.23.13; host104:192.168.23.104

[root@host104 ~]# vim /etc/redis/6379.conf
#70行,修改监听地址为0.0.0.0,监听所有ip
70// bind 0.0.0.0

#137行,开启守护进程,默认开启
137// daemonize yes

#172行,指定日志文件目录,默认即可
172// logfile /var/log/redis_6379.log

#264行,指定工作目录,默认即可
264// dir /var/lib/redis/6379


 #288行,仿照287行的格式,指定要同步的master节点ip和端口
 288// replicaof 192.168.23.103 6379

#700行,开启AOF持久化功能
700// appendonly yes

:wq

[root@host104 ~]# /etc/init.d/redis_6379  restart


[root@host104 ~]# netstat  -natp | grep redis


image-20210922190432646

image-20210922190359150





2.4验证主从

在Master节点上查看日志

[root@host103 ~]# cat   /var/log/redis_6379.log
....
Replica 192.168.23.104:6379 asks for synchronization
.....
Replica 192.168.23.13:6379 asks for synchronization

image-20210922190628815





在Master 节点上验证从节点

[root@host103 ~]# redis-cli info replication

image-20210922190842510





三 redis哨兵模式

哨兵的核心功能:在主从复制的基础上,哨兵引入了主节点故障自动转移



3.1 redis哨兵的原理

哨兵(sentinel):是一个分布式系统,用于主从结构中的每台服务器进行监控,当出现故障时通过投票机制,选择新的Master,并将所有slave 连接到新的master。所以整个运行哨兵的集群数据不得少于3台。

  • 哨兵模式是分布式系统去中心化的模式.由leader和follower 组成..当leader 宕机后,follower 选举产生leader.

  • 当哨兵集群宕机的服务器超过半数,则集群失效

  • 组成哨兵集群的 redis 服务器数量必须是奇数个数

3.2 redis哨兵的作用

  • 监控:哨兵会不断地检查主节点和从节点是否运作正常。
  • 自动故障转移:当主节点不能正常工作时,哨兵会开始自动故障转移操作,它会将失效主节点放到其中一个从节点升级为新的主节点,并让其他从节点改为复制新的主节点。
  • 通知(提醒):哨兵可以将故障转移的结果发送给客户端。





3.3 哨兵的组成

哨兵结构由两部分组成,哨兵节点和数据节点,哨兵节点的端口号是26379。

  • 哨兵节点:哨兵系统由一个或多个哨兵节点组成,哨兵节点是特殊的redis节点,不存储数据。
  • 数据节点:主节点和从节点都是数据节点。





3.4故障转移机制

(1) 由哨兵节点定期监控发现主节点是否出现了故障

每个哨兵节点每隔1秒会向主节点,从节点,其他哨兵节点发送一次ping 命令做一次心跳检测。如果主节点在一定时间范围内不回复或者是回复一个错误信息,那么这个哨兵就会认为这个主节点主观下线(单方面认为)当超过半数哨兵节点认为该主节点主管下线了,这样就客观下线了



(2) 当主节点出现故障,此时哨兵节点会通过Raft算法(选举算法)实现选举机制共同选举出一个哨兵节点为leader,来负责处理主节点的故障转移和通知。所以,运行哨兵的集群的数量不能少于3个节点。



(3) 由leader 哨兵节点执行故障转移。过程:

  • 将某一个从节点升级为新的主节点,让其他从节点指向新的主节点。
  • 若原主节点恢复,也变成从节点,并指向新的主节点。
  • 通知客户端主节点已经更换.



需要特别注意的是,客观下线是主节点才有的概念;如果从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观下线和故障转移操作






3.5 哨兵的主节点选举

  1. 过滤掉不健康(已经下线的),没有回复哨兵ping 响应的从节点。
  2. 选择配置文件中从节点优先级配置最高的。(replica-priority,默认为100)
  3. 选择复制偏移量最大,也就是最完整的从节点.

哨兵的启动依赖于主从模式,所以必须把主从模式安装好的情况下再去做哨兵模式.所有节点上都需要部署哨兵模式,哨兵模式会监控所有的redis工作节点是否正常,当master出现问题的时候,因为其他节点与主节点失去联系,因此会投票,投票过半就会认为这个master的确出现问题,然后会通知哨兵间,然后从 slave中选取一个作为新的master。

img





四:搭建redis哨兵模式

4.1 服务器分配

出于节约机器考虑,把哨兵节点和数据节点合并了

master节点:192.168.23.103

slave1节点:192.168.23.104

slave2 节点:192.168.23.13

systemctl stop firewalld

setenforce 0





4.2所有哨兵节点修改配置文件

在redis解压安装的时候,就在解压包的目录下有sentinel.conf,这是哨兵模式的配置文件

image-20210922202912538



[root@host103 redis-5.0.7]# vim /opt/redis-5.0.7/sentinel.conf 
#17行,关闭保护模式
17//  protected-mode no

#21行,redis哨兵监听端口。保持默认的26379即可
21// port 26379

#26行,指定sentinel为后台启动
26// daemonize yes

#36行,指定日志存放路径
36// logfile "/var/log/sentinel.log"

#65,指定数据库存放路径
65// dir "/var/lib/redis/6379"


#84行,指定该哨兵监控192.168.23.103:6379这个主节点。
#该主节点名称为mymaster
#最后的 2 的含义为:至少2 个哨兵节点同意,才能判定主节点故障并进行故障转移
84// sentinel monitor mymaster 192.168.23.103 6379 2

#113行,判定服务器down点的时间间隔,默认为30000毫秒(30s),保持默认即可
113// sentinel down-after-milliseconds mymaster 30000

#146行,故障节点的最大超时时间为180000毫秒(180s)
146// sentinel failover-timeout mymaster 180000





4.3 启动哨兵模式,查看哨兵信息

启动哨兵模式

先启动master,再启动slave

[root@host103 redis-5.0.7]# cd /opt/redis-5.0.7/
[root@host103 redis-5.0.7]# redis-sentinel sentinel.conf  &
[1] 9550



查看哨兵信息

[root@host103 redis-5.0.7]# redis-cli -p 26379 info Sentinel

image-20210922204857847





4.4 故障模拟

查看redis-server的进程号

[root@host103 redis-5.0.7]# ps -ef | grep redis

image-20210922205114975



结束Master 节点上的redis-server进程

#先强制停止redis-serber
[root@host103 redis-5.0.7]# kill -9 8041
[root@host103 redis-5.0.7]# ps -ef | grep redis

#删除redis的进程文件
[root@host103 redis-5.0.7]# rm -rf /var/run/redis_6379.pid
#启动redis服务
[root@host103 redis-5.0.7]# /etc/init.d/redis_6379 start 

image-20210922205326005



验证结果

(1),查看redis的日志

[root@host103 redis-5.0.7]# tail -f /var/log/sentinel.log 

image-20210922210942120



(2)查看哨兵信息

[root@host103 ~]# redis-cli -p 26379 INFO Sentinel

image-20210922205733881



(3)查看redis的主配置文件

#在原来的mster节点上查看配置文件/etc/redis/6379.conf
[root@host103 ~]# vim /etc/redis/6379.conf
#在配置文件最后一行,原master重新启动后,变为了从节点,并且指向新的master节点192.168.23.104:6379
1375 replicaof 192.168.23.104 6379

image-20210922211205323






五:redis的cluster集群模式


集群,即 redis cluster。是redis 3.0开始引入的分布式存储方案。

集群由多个节点(node)组成。redis的数据 分布在这些节点中。集群中的节点分为主节点和从节点;只有主机欸按负责读写请求和集群信息的维护;从节点只进行主节点数据和状态的复制



5.1 集群的作用

集群的作用 可以归纳为 两点:

  • 数据分区:数据分区(或称数据分片)是集群最核心的功能。
    • 集群将数据分散到多个节点,一方面突破了Redis单机内存大小的限制,存储容量大大增加;另一方面每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力。
    • Redis单机内存大小受限问题,在介绍持久化和主从复制时都有提及;例如,如果单机内存太大, bgsave和bgrewriteaof的fork操作可能导致主进程阻塞,主从环境下主机切换时可能导致从节点长时间无法提供服务,全量复制阶段主节点的复制缓冲区可能溢出。

  • 高可用:集群支持主从复制和主节点的自动故障转移(与哨兵类似) :
    • 当任一节点发生故障时,集群仍然可以对外提供服务。

因为数据分区这个功能,并且,每个主节点都可以对外提供读写服务,所以,就实现了负载均衡功能





5.2 redis集群的数据分片

Redis集群的数据分片:

Redis集群引入了哈希槽的概念

Redis集群有16384个哈希槽(编号0-16383)

集群的每个节点负责一部分哈希槽

创建或读取Key时通过CRC16校验后得出一个数,用该数字除以16384取余,通过余数来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存储或读取的操作



以3个节点组成的集群为例:

节点A包含0到5460号哈希槽

节点B包含5461到10922号哈希槽

节点C包含10923到16383号哈希槽



redis集群的主从复制模型:

集群中具有A、B、C三个节点,如果节点B失败了,整个集群就会因缺少5461-10922这个范围的槽而不可以用。

为每个节点添加一个从节点A1、B1、C1整个集群便有三个Master节点和三个slave节点组成,在节点B失败后,集群选举B1位为的主节点继续服务。当B和B1都失败后,集群将不可用。

img





六: 搭建redis集群模式

6.1配置redis多实例

redis的集群一般需要6个节点,3主3从。方便起见,也因为资源限制,这里所有节点在同一台服务器上模拟:以端口进行区分:3个主节点端口 6001/6002/6003,3个从节点:6004/6005/6006

[root@host103 ~]# cd /etc/redis/

#创建工作目录
[root@host103 redis]# mkdir -p redis-cluster/redis600{1..6}

#将主配置文件和 redis-cli,redis-server可执行文件复制到各个实例的工作目录中
#redis.conf :redis 的配置文件
#redis-cli :  redis 客户端工具
#redis-server: redis 的主服务,启动redis节点
[root@host103 redis]# for i in {1..6}
> do
> cp /opt/redis-5.0.7/redis.conf  /etc/redis/redis-cluster/redis600$i
> cp /opt/redis-5.0.7/src/redis-cli  /opt/redis-5.0.7/src/redis-server  /etc/redis/redis-cluster/redis600$i
> done


[root@host103 redis]# ls -R /etc/redis/redis-cluster/

image-20210922213854475





6.2修改配置文件,开启集群功能

其他5个目录的配置文件以此类推,注意6个端口都要不一样

[root@host103 redis]# cd /etc/redis/redis-cluster/redis6001
[root@host103 redis6001]# vim redis.conf
#69行,
 69// #bind 127.0.0.1,注释bind项,默认监听所有网卡
 
 #88行,关闭保护模式
 88// protected-mode no
 
 #92行,修改redis监听端口
 92// port 6001
 
 #136行,开启守护进程,以独立进程启动
 136// daemonize yes
 
 #700行,开启aof持久化
 700// appendonly yes
 
 #832行,取消注释,开启集群功能
 832//  cluster-enabled yes
 
 #840行,取消注释,设置集群文件名称
 840//  cluster-config-file nodes-6001.conf
 
 #846行,取消注释,设置集群超时时间
 846//  cluster-node-timeout 15000
 

因为是在一台机器上模拟,所以要修改端口号。如果是在多台主机上做,就不用改端口。

同样,bind 监听,因为是在一台主机上做,所以注释。如果是在多台主机做,就要监听各自的物理ip地址





6.3 启动redis节点

分别进入6个目录,执行命令 redis-server redis.conf

[root@host103 redis6001]# for i in {1..6}
> do
> cd /etc/redis/redis-cluster/redis600$i
> redis-server redis.conf 
> done

[root@host103 redis6006]# ps -ef | grep redis

image-20210922220553994





6.4启动集群

因为是在一台主机上做,所以就用127.0.0.1.如果是不同的主机上,则ip要区分清楚

#启动集群。前面的三个为主,后面的做从节点。下面交互时,需要输入yes才可以创建
#--cluster-replicase 1 表示每个主节点有1个从节点。
[root@host103 redis6006]# redis-cli  --cluster create \
> 127.0.0.1:6001 127.0.0.1:6002 127.0.0.1:6003 \
> 127.0.0.1:6004 127.0.0.1:6005 127.0.0.1:6006 \
> --cluster-replicas 1

image-20210922221556361

image-20210922221930850





6.5 验证集群

启动集群模式连接数据库,查看哈希槽

# -p 指点端口
#-c ,启动集群模式,节点之间可以互相跳转
[root@host103 ~]# redis-cli -p 6001 -c
#查看集群哈希槽编号范围
127.0.0.1:6001> cluster slots

image-20210922222814471



连接主库,写入数据

127.0.0.1:6001> set boss wanglei
OK
127.0.0.1:6001> set teacher zhangsan
-> Redirected to slot [12541] located at 127.0.0.1:6003
OK

image-20210922223313640



集群中查看键值,获取键的哈希值

127.0.0.1:6003> keys *
1) "teacher"
127.0.0.1:6003> get boss 
-> Redirected to slot [4126] located at 127.0.0.1:6001
"wanglei"
127.0.0.1:6001> keys *
1) "boss"
127.0.0.1:6001> CLUSTER KEYSLOT boss
(integer) 4126

image-20210922223813572



在从节点查看

[root@host103 ~]# redis-cli -p 6004 -c
127.0.0.1:6004> keys *
(empty list or set)
127.0.0.1:6004> exit
[root@host103 ~]# redis-cli -p 6005 -c
127.0.0.1:6005> keys *
1) "teacher"
127.0.0.1:6005> exit
[root@host103 ~]# redis-cli -p 6006 -c
127.0.0.1:6006> keys *
1) "boss"
127.0.0.1:6006> get teacher 
-> Redirected to slot [12541] located at 127.0.0.1:6003
"zhangsan"
127.0.0.1:6003>

image-20210922224439425

这篇关于redis高可用之主从复制,哨兵,集群的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!