• Redis高可用方案之哨兵模式


    哨兵(sentinel)是Redis的高可用性(High Availability)的解决方案:

    • 由一个或多个sentinel实例组成sentinel集群可以监视一个或多个主服务器和多个从服务器。
    • 当主服务器进入下线状态时,sentinel可以将该主服务器下的某一从服务器升级为主服务器继续提供服务,从而保证redis的高可用性。

    1、部署方案

     

    2、搭建配置

    • 在一台机器上采用伪分布式的方式部署。(生产环境应该是多台机器)
    • 根据上面的部署方案搭建如下:
    • Redis-Master :127.0.0.1 6379
    • 采用安装的方式,正常安装和配置
    1. #1 安装redis5.0
    2. mkdir redis-master
    3. cd /var/redis-5.0.5/src/
    4. make install PREFIX=/var/redis-ms/redis-master
    5. cp /var/redis-5.0.5/redis.conf /var/redis-ms/redis-master/bin
    6. #2 修改redis.conf
    7. # 将`daemonize`由`no`改为`yes`
    8. daemonize yes
    9. # 默认绑定的是回环地址,默认不能被其他机器访问
    10. # bind 127.0.0.1
    11. # 是否开启保护模式,由yes该为no
    12. protected-mode no

    Redis-Slaver1:127.0.0.1 6380

    1. #安装redis-slaver1
    2. mkdir redis-slaver1
    3. cp -r /var/redis-ms/redis-master/* /var/redis-ms/redis-slaver1
    4. #修改配置文件
    5. vim /var/redis-ms/redis-slaver1/redis.conf
    6. # 在配置文件中添加如下内容
    7. port 6380
    8. replicaof 127.0.0.1 6379

    Redis-Slaver2:127.0.0.1 6381

    1. #安装redis-slaver2
    2. mkdir redis-slaver2
    3. cp -r /var/redis-ms/redis-master/* /var/redis-ms/redis-slaver2
    4. #修改配置文件
    5. vim /var/redis-ms/redis-slaver2/redis.conf
    6. port 6381
    7. replicaof 127.0.0.1 6379

    Redis-Sentinel1:127.0.0.1 26379

    1. #安装redis-sentinel1
    2. mkdir redis-sentinel1
    3. cp -r /var/redis-ms/redis-master/* /var/redis-ms/redis-sentinel1
    4. #拷贝sentinel.conf 配置文件并修改
    5. cp /var/redis-5.0.5/sentinel.conf /var/redis-ms/redis-sentinel1
    6. # 哨兵sentinel实例运行的端口 默认26379
    7. port 26379
    8. # 将`daemonize`由`no`改为`yes`
    9. daemonize yes
    10. # 哨兵sentinel监控的redis主节点的 ip port
    11. # master-name 可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。
    12. # quorum 当这些quorum个数sentinel哨兵认为master主节点失联 那么这时 客观上认为主节点失联了
    13. # sentinel monitor <master-name> <ip> <redis-port> <quorum>
    14. sentinel monitor mymaster 127.0.0.1 6379 2
    15. # 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码
    16. # 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码
    17. # sentinel auth-pass <master-name> <password>
    18. sentinel auth-pass mymaster MySUPER--secret-0123passw0rd
    19. # 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒,改成3
    20. # sentinel down-after-milliseconds <master-name> <milliseconds>
    21. sentinel down-after-milliseconds mymaster 3000
    22. # 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行同步,
    23. # 这个数字越小,完成failover所需的时间就越长,
    24. # 但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。
    25. # 可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
    26. # sentinel parallel-syncs <master-name> <numslaves>
    27. sentinel parallel-syncs mymaster 1
    28. # 故障转移的超时时间 failover-timeout 可以用在以下这些方面:
    29. #1. 同一个sentinel对同一个master两次failover之间的间隔时间。
    30. #2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
    31. #3.当想要取消一个正在进行的failover所需要的时间。
    32. #4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了
    33. # 默认三分钟
    34. # sentinel failover-timeout <master-name> <milliseconds>
    35. sentinel failover-timeout mymaster 180000

    Redis-Sentinel2:127.0.0.1 26380

    1. #安装redis-sentinel2
    2. mkdir redis-sentinel2
    3. cp -r /var/redis-ms/redis-sentinel1/* /var/redis-ms/redis-sentinel2
    4. #修改sentinel.conf
    5. vim /var/redis-ms/redis-sentinel2/sentinel.conf
    6. port 26380

    Redis-Sentinel3:127.0.0.1 26381

    1. #安装redis-sentinel3
    2. mkdir redis-sentinel3
    3. cp -r /var/redis-ms/redis-sentinel1/* /var/redis-ms/redis-sentinel3
    4. #修改sentinel.conf
    5. vim /var/redis-ms/redis-sentinel3/sentinel.conf
    6. port 26381

    配置好后依次执行

    redis-master、redis-slaver1、redis-slaver2、redis-sentinel1、redis-sentinel2、redis-sentinel3

    1. #启动redis-master和redis-slaver
    2. 在redis-master目录下 ./redis-server redis.conf
    3. 在redis-slaver1目录下 ./redis-server redis.conf
    4. 在redis-slaver2目录下 ./redis-server redis.conf
    5. #启动redis-sentinel
    6. 在redis-sentinel1目录下 ./redis-sentinel sentinel.conf
    7. 在redis-sentinel2目录下 ./redis-sentinel sentinel.conf
    8. 在redis-sentinel3目录下 ./redis-sentinel sentinel.conf

    3、执行流程

    启动并初始化Sentinel

    • Sentinel是一个特殊的Redis服务器不会进行持久化
    • Sentinel实例启动后,每个Sentinel会创建2个连向主服务器的网络连接
    • 命令连接:用于向主服务器发送命令,并接收响应;
    • 订阅连接:用于订阅主服务器的—sentinel—:hello频道。

    获取主服务器信息:Sentinel默认每10s一次,向被监控的主服务器发送info命令,获取主服务器和其下属从服务器的信息。 

    1. 127.0.0.1:6379> info
    2. # Server
    3. redis_version:5.0.5
    4. os:Linux 3.10.0-229.el7.x86_64 x86_64
    5. run_id:a4e06ab61b4116660aa37b85079ed482b0b695b1
    6. # Replication
    7. role:master
    8. connected_slaves:2
    9. slave0:ip=127.0.0.1,port=6380,state=online,offset=1571684,lag=1
    10. slave1:ip=127.0.0.1,port=6381,state=online,offset=1571551,lag=1
    11. master_replid:366322125dd7dc9bc95ed3467cfec841c112e207
    12. master_replid2:0000000000000000000000000000000000000000
    13. master_repl_offset:1571684
    14. second_repl_offset:-1
    15. repl_backlog_active:1
    16. repl_backlog_size:1048576
    17. repl_backlog_first_byte_offset:523109
    18. repl_backlog_histlen:1048576

    获取从服务器信息:

            当Sentinel发现主服务器有新的从服务器出现时,Sentinel还会向从服务器建立命令连接和订阅连接。在命令连接建立之后,Sentinel还是默认10s一次,向从服务器发送info命令,并记录从服务器的信息。

    1. # Server
    2. redis_version:5.0.5
    3. os:Linux 3.10.0-229.el7.x86_64 x86_64
    4. run_id:e289b3286352aaf8cc9f1ac7ebcc6d36131b8321
    5. # Replication
    6. role:slave
    7. master_host:127.0.0.1
    8. master_port:6379
    9. master_link_status:up
    10. master_last_io_seconds_ago:0
    11. master_sync_in_progress:0
    12. slave_repl_offset:1699595
    13. slave_priority:100
    14. slave_read_only:1
    15. connected_slaves:0
    16. master_replid:366322125dd7dc9bc95ed3467cfec841c112e207
    17. master_replid2:0000000000000000000000000000000000000000
    18. master_repl_offset:1699595
    19. second_repl_offset:-1
    20. repl_backlog_active:1
    21. repl_backlog_size:1048576
    22. repl_backlog_first_byte_offset:651020
    23. repl_backlog_histlen:1048576

    向主服务器和从服务器发送消息(以订阅的方式) 

            默认情况下,Sentinel每2s一次,向所有被监视的主服务器和从服务器所订阅的—sentinel—:hello频道上发送消息,消息中会携带Sentinel自身的信息和主服务器的信息。

    PUBLISH _sentinel_:hello "< s_ip > < s_port >< s_runid >< s_epoch > < m_name > < m_ip >< m_port ><m_epoch>"

    接收来自主服务器和从服务器的频道信息

            当Sentinel与主服务器或者从服务器建立起订阅连接之后,Sentinel就会通过订阅连接,向服务器发送以下命令:

    subscribe —sentinel—:hello

            Sentinel彼此之间只创建命令连接,而不创建订阅连接,因为Sentinel通过订阅主服务器或从服务器,就可以感知到新的Sentinel的加入,而一旦新Sentinel加入后,相互感知的Sentinel通过命令连接来通信就可以了。

    检测主观下线状态

    • Sentinel每秒一次向所有与它建立了命令连接的实例(主服务器、从服务器和其他Sentinel)发送PING命令
    • 实例在down-after-milliseconds毫秒内返回无效回复(除了+PONG、-LOADING、-MASTERDOWN外)
    • 实例在down-after-milliseconds毫秒内无回复(超时)
    • Sentinel就会认为该实例主观下线(SDown)

    检查客观下线状态

    • 当一个Sentinel将一个主服务器判断为主观下线后
    • Sentinel会向同时监控这个主服务器的所有其他Sentinel发送查询命令

    主机的:

    SENTINEL is-master-down-by-addr <ip> <port> <current_epoch> <runid>

    其他Sentinel回复:

    <down_state>< leader_runid >< leader_epoch >

            判断它们是否也认为主服务器下线。如果达到Sentinel配置中的quorum数量的Sentinel实例都判断主服务器为主观下线,则该主服务器就会被判定为客观下线(ODown)。

    选举Leader Sentinel

            当一个主服务器被判定为客观下线后,监视这个主服务器的所有Sentinel会通过选举算法(raft),选出一个Leader Sentinel去执行failover(故障转移)操作。

    4、哨兵leader选举

    Raft

    • Raft协议是用来解决分布式系统一致性问题的协议。
    • Raft协议描述的节点共有三种状态:Leader, Follower, Candidate。
    • term:Raft协议将时间切分为一个个的Term(任期),可以认为是一种“逻辑时间”。

    选举流程:

    • Raft采用心跳机制触发Leader选举
    • 系统启动后,全部节点初始化为Follower,term为0。
    • 节点如果收到了RequestVote或者AppendEntries,就会保持自己的Follower身份
    • 节点如果一段时间内没收到AppendEntries消息,在该节点的超时时间内还没发现Leader,Follower就会转换成Candidate,自己开始竞选Leader。

    一旦转化为Candidate,该节点立即开始下面几件事情:

    • 增加自己的term。
    • 启动一个新的定时器。
    • 给自己投一票。
    • 向所有其他节点发送RequestVote,并等待其他节点的回复。
    • 如果在计时器超时前,节点收到多数节点的同意投票,就转换成Leader。同时向所有其他节点发送AppendEntries,告知自己成为了Leader。
    • 每个节点在一个term内只能投一票,采取先到先得的策略,Candidate前面说到已经投给了自己,Follower会投给第一个收到RequestVote的节点。
    • Raft协议的定时器采取随机超时时间,这是选举Leader的关键。
    • 在同一个term内,先转为Candidate的节点会先发起投票,从而获得多数票。

    Sentinel的leader选举流程

    1. 某Sentinel认定master客观下线后,该Sentinel会先看看自己有没有投过票,如果自己已经投过票给其他Sentinel了,在一定时间内自己就不会成为Leader。
    2. 如果该Sentinel还没投过票,那么它就成为Candidate。
    3. Sentinel需要完成几件事情:
      1. 更新故障转移状态为start
      2. 当前epoch加1,相当于进入一个新term,在Sentinel中epoch就是Raft协议中的term。
      3. 向其他节点发送is-master-down-by-addr 命令请求投票。命令会带上自己的epoch。
      4. 给自己投一票(leader、leader_epoch)
    4. 当其它哨兵收到此命令时,可以同意或者拒绝它成为领导者;(通过判断epoch)
    5. Candidate会不断的统计自己的票数,直到他发现认同他成为Leader的票数超过一半而且超过它配置的quorum,这时它就成为了Leader。
    6. 其他Sentinel等待Leader从slave选出master后,检测到新的master正常工作后,就会去掉客观下线的标识。

    故障转移

            当选举出Leader Sentinel后,Leader Sentinel会对下线的主服务器执行故障转移操作,主要有三个步骤:

    1. 它会将失效Master 的其中一个Slave 升级为新的Master , 并让失效Master 的其他Slave 改为复制新的Master ;
    2. 当客户端试图连接失效的Master 时,集群也会向客户端返回新Master 的地址,使得集群可以使用现在的Master 替换失效Master 。
    3. Master 和Slave 服务器切换后, Master 的redis.conf 、Slave 的redis.conf 和sentinel.conf 的配置文件的内容都会发生相应的改变,即, Master 主服务器的redis.conf配置文件中会多一行replicaof 的配置, sentinel.conf 的监控目标会随之调换。

    5、主服务器的选择

    哨兵leader根据以下规则从客观下线的主服务器的从服务器中选择出新的主服务器。

    1. 过滤掉主观下线的节点
    2. 选择slave-priority最高的节点,如果由则返回没有就继续选择
    3. 选择出复制偏移量最大的系节点,因为复制偏移量越大则数据复制的越完整,如果由就返回了,没有就继续
    4. 选择run_id最小的节点,因为run_id越小说明重启次数越少
  • 相关阅读:
    【工程数学】笔记1:复变函数和积分变换
    hdu 3549 Flow Problem(最大流模板题)
    助力智慧交通,开发构建道路交通场景下智能车辆检测识别系统
    C数据结构-翻转指针法、头插法实现单链表反转
    trick2-mobilenetv1、mobilenetv2、mobilenetv3替换YOLO主干
    Chapter7: SpringBoot与数据访问
    ubuntu 安装、配置FTP
    论文阅读笔记 | 三维目标检测——AVOD算法
    ZZNUOJ_C语言的算法「零基础9讲」和「题库150例练习」-总目录(更新中)
    浅谈游戏开发中客户端需要了解的设计模式
  • 原文地址:https://blog.csdn.net/weixin_52851967/article/details/127763668