• redis高可用——主从复制、哨兵模式、cluster集群


    目录

    1、redis群集有三种模式

    2、主从复制

    2.1、概述:

    2.2、Redis主从复制有以下几个重要作用:

    2.3、主从复制流程:

    2.4、redis主从复制实验

    3、哨兵模式.

    3.1、概述:

    3.2、 哨兵的核心功能:

    3.3、哨兵模式原理:

    3.6、 哨兵模式的作用;

    3.7、故障转移机制

    3.8、主节点的选举:

    3.9、主节点选举原则:

    3.10、哨兵模式流程:

    3.11、搭建Redis 哨兵模式以及故障模拟

    4、集群

    4.1、概述

    4.2、集群的作用

    4.3、Redis集群的数据分片:

    4.4、  搭建Redis 群集模式


     

    1、redis群集有三种模式

    分别是主从同步/复制、哨兵模式、Cluster,下面会讲解一下三种模式的工作方式,以及如何搭建cIustr群集
    主从复制:主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复。

    缺陷:故障恢复无法自动化;写操作无法负载均衡;存储能力受到单机的限制。

    哨兵:在主从复制的基础上,哨兵实现了自动化的故障恢复

    缺陷:写操作无法负载均衡:在储能力受到单机的眼制:哨兵无法对从节点进行自动故障转移,在读写分离场景下,从节点故障会导致读服务不可用,需要对从节点做额外的监控、切换操作

    集群:通过集群,Redis解决了写操作无法负载均衡,以及存储能力受到单机限制的问题,实现了较为完善的高可用方案。

    2、主从复制

    2.1、概述:

    主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(Master),后者称为从节点(Slave);数据的复制是单向的,只能由主节点到从节点。

    默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。

    2.2、Redis主从复制有以下几个重要作用:

    1. 数据冗余备份:

    通过主从复制,将主服务器的数据实时同步到多个从服务器上,可以实现数据的冗余备份。当主服务器发生故障或数据丢失时,可以通过从服务器恢复数据,保证数据的可靠性和持久性。

    2. 高可用性:

    通过主从复制,可以实现Redis的高可用性。当主服务器出现故障时,可以将其中一台从服务器提升为新的主服务器,继续提供服务而不中断。这种自动故障切换的机制可以有效地减少系统的停机时间,提高系统的可用性。

    3. 负载均衡:

    通过读写分离的方式,将读操作分摊到多个从服务器上进行处理,可以提高整个系统的读取性能。主服务器负责处理写操作,而从服务器负责处理读操作,从而实现负载均衡,减轻主服务器的压力。

    4. 扩展性:

    通过主从复制,可以方便地扩展Redis的读容量。当系统的读取需求增加时,只需要添加更多的从服务器来处理读操作即可,而主服务器则专注于处理写操作。这种水平扩展的方式可以有效地提升系统的整体性能和吞吐量。

    5. 故障恢复:

    当主服务器发生故障或数据丢失时,可以通过从服务器进行数据恢复。从服务器保存了主服务器的数据副本,可以用于重新构建主服务器的数据状态,快速恢复服务。

    总之,Redis主从复制在提供数据冗余备份、保证高可用性、实现负载均衡和扩展性方面发挥着重要作用,是搭建可靠、高效的Redis系统的基础组件之一。

    2.3、主从复制流程:

    1. 若启动一个Slave机器进程,则它会向Master机器发送一个“sync command”命令,请求同步连接。
    2. 无论是第一次连接还是重新连接,Master机器都会启动一个后台进程,将数据快照保存到数据文件中(执行rdb操作),同时Master还会记录修改数据的所有命令并缓存在数据文件中。
    3. 后台进程完成缓存操作之后,Master机器就会向Slave机器发送数据文件,Slave端机器将数据文件保存到硬盘上,然后将其加载到内存中,接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若Slave出现故障导致宕机,则恢复正常后会自动重新连接。
    4. Master机器收到Slave端机器的连接后,将其完整的数据文件发送给Slave端机器,如果Mater同时收到多个Slave发来的同步请求,则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的Slave端机器,确保所有的Slave端机器都正常。

    2.4、redis主从复制实验

    Master节点: 192.168.41.21

    Slave1节点: 192.168.41.22

    Slave2节点: 192.168.41.23

    关闭防火墙

    1. systemctl stop firewalld
    2. setenforce 0

    -安装 Redis以及依赖环境

    yum install -y gcc gcc-c++ make

    1. tar zxvf redis-5.0.7.tar.gz -C /opt/
    2. wget -p /opt http://download.redis.io/releases/redis-5.0.9.tar.gz
    3. cd /opt/redis-5.0.7/
    4. make
    5. make PREFIX=/usr/local/redis install
    6. cd /opt/redis-5.0.7/utils

    优化

    ln -s /usr/local/redis/bin/* /usr/local/bin/

     配置主服务器

    1. vim /etc/redis/6379.conf redis.conf
    2. bind 0.0.0.0 #70行,修改监听地址为0.0.0.0
    3. daemonize yes #137行,开启守护进程
    4. logfile /var/log/redis_6379.log #172行,指定日志文件目录
    5. dir /var/lib/redis/6379 #264行,指定工作目录
    6. appendonly yes #700行,开启AOF持久化功能
    7. /etc/init.d/redis_6379 restart

    更改监听地址

    开启守护进程

    指定日志文件

    指定工作目录

    开启AOF持久化功能

     配置完成后重启

    配置从服务器(两个从服务器配置修改步骤相同)

    1. vim /etc/redis/6379.conf
    2. bind 0.0.0.0 #70行,修改监听地址为0.0.0.0
    3. daemonize yes #137行,开启守护进程
    4. logfile /var/log/redis_6379.log #172行,指定日志文件目录
    5. dir /var/lib/redis/6379 #264行,指定工作目录
    6. replicaof 192.168.10.23 6379 #288行,指定要同步的Master节点IP和端口
    7. appendonly yes #700行,开启AOF持久化功能
    8. /etc/init.d/redis_6379 restart

    修改监听地址为0.0.0.0

    开启守护进程

    172行,指定日志文件目录

    264行,指定工作目录

    288行,指定要同步的Master节点IP和端口

    700行,开启AOF持久化功能

    配置完成后进行验证

    在Master节点上看日志:

    1. tail -f /var/log/redis_6379.log
    2. 在Master节点上验证从节点:
    3. redis-cli info replication

     

    3、哨兵模式.

    3.1、概述:

     主从切换技术的方法是,当服务器宕机后,需要手动一台从机切换为主机,这需要人工干预,不仅费时费力而日还会造成一段时间内服务不可用。为了解决主从复制的缺点,就有了哨兵机制。

    3.2、 哨兵的核心功能:

    在主从复制的基础上,哨兵引入了主节点的自动故障转移。

    3.3、哨兵模式原理:

    哨兵(sentinel):是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的Master并将所有slave连接到新的 Master。所以整个运行哨兵的集群的数量不得少于3个节点。

     是一种在分布式系统中用于监控和保护资源的设计模式。其原理基于引入一个特殊的组件,即"哨兵",该组件负责监控系统中的关键资源或服务,并采取相应的措施来保证其可用性和稳定性。

    哨兵模式的原理几个步骤:
    1. 监控:

    哨兵组件负责定期监控目标资源或服务的状态。它可以通过各种方式,如心跳检测、定期发送请求等来获取目标资源的健康状况。
    2. 健康状态评估:

    哨兵根据监控得到的数据对目标资源的健康状态进行评估。例如,判断服务是否正常响应,资源是否超出阈值等。
    3. 决策:

    根据资源的健康状态,哨兵会做出相应的决策。如果资源处于正常状态,哨兵不会采取任何操作。但一旦发现资源异常,哨兵将触发相应的操作。
    4. 恢复与补救措施:

    一旦哨兵检测到资源异常,它可以采取多种措施来恢复资源的正常状态,比如自动重启服务、切换到备用服务、通知运维人员等。
    5. 反馈机制:

    哨兵还可以通过向监控中心或其他相关组件发送反馈信息,以便后续分析和处理。

    通过引入哨兵模式,系统能够及时发现并处理资源异常,提高系统的可用性和稳定性。它在微服务架构、容器化部署等场景下得到广泛应用,能够有效地保护系统免受单点故障的影响,并提供自动化的恢复机制。

    3.6、 哨兵模式的作用;

    1、监控: 哨兵会不断地检查主节点和从节点是否运作正常

    2、自动故障转移:当主节占不能下常工作时,哨兵会开始自动故障转移操作,它会将失效主节点的其中一个从节点升级为新的主书点,并让其它从节点改为复制新的主节点。

    3、通知(提醒) : 哨兵可以将故障转移的结果发送给客户端。

    哨兵模式在分布式系统中的作用主要有以下几个方面:

    1. 监控可用性:

    哨兵模式能够实时监控组件或服务的可用性。通过定期发送健康检查请求,哨兵可以检测到组件是否正常工作,从而及时发现故障或异常情况。

    2. 故障检测与转移:

    一旦哨兵检测到组件不可用,它可以触发故障转移机制,将流量切换到备用组件或服务上。这样可以避免单点故障、提高系统的容错能力和可用性。

    3. 告警通知:

    哨兵模式能够根据监控结果触发告警通知,向相关人员发送警报,以便及时发现并解决问题。这有助于减少系统停机时间,保证业务的连续性。

    4. 自动恢复:

    一旦被保护组件恢复正常,哨兵可以自动将流量重新引导到原始组件上,实现自动化的恢复过程。这样可以缩短系统的恢复时间,减少人工干预的需求。

    5. 动态扩展:

    哨兵模式还可以根据实际负载情况动态地扩展或缩减组件的数量。通过监控系统的负载情况,哨兵可以根据需要增加或减少组件的实例,以满足系统的性能要求。

    哨兵模式的作用是提供对分布式系统中组件或服务的可用性和健康状态的监控与保护,从而提高系统的稳定性、可用性和扩展性。

    3.7、故障转移机制

    1、由哨兵节点定期监控发现主节点是否出现了故障

    每个哨兵节点每隔1秒会向主节点、从节点及其它哨兵节点发送一次oing命令做一次心跳检测。如果主节点在一定时间范围内不复或者是回复一个错误消息,那么这个哨兵就会认为这个主节点主观下线了 (单方面的》。当超过半数哨兵节点认为该主节点主观下线了,这样就客观下线了。

    2、,当主节点出现故障,此时哨兵节点会通过Rat算法(选举算法)实现选举机制共同选举出一个哨兵节点为leager,来负责处理主节点的故障转移和通知。所以整个运行哨兵的集群的数量不得少于3个节点。

    3、由leader哨兵节点执行故障转移,过程如下

    1. ·将某一个从节点升级为新的主节点,让其它从节点指向新的主节点;
    2. ·若原主节点恢复也变成从节点,并指向新的主节点;
    3. 通知客户端主节点已经更换

     哨兵模式的故障转移机制主要包括以下几个步骤:

    1. 健康检查:

    哨兵会定期发送健康检查请求来监测被保护组件的可用性。这些检查可以是简单的心跳检测,也可以是更复杂的应用层检查,例如发送请求并验证响应。

    2. 故障检测:

    当哨兵发现被保护组件无法正常工作时,它会将该组件标记为不可用状态,并触发故障转移流程。

    3. 切换流量:

    在故障转移过程中,哨兵会将流量从故障组件切换到备用组件或服务上。这可以通过负载均衡器、代理服务器或DNS解析等方式实现。

    4. 转发请求:

    一旦流量被切换到备用组件上,哨兵会将新的请求转发给备用组件进行处理。这确保了系统可以继续提供服务,即使某个组件出现故障。

    5. 恢复检测:

    在故障组件修复后,哨兵会重新进行健康检查。如果故障组件恢复正常,则会将流量重新引导回原始组件,以便正常运行。

    整个故障转移过程是自动化的,哨兵会根据预定义的策略和配置来执行相应的操作。这样可以最大程度地减少系统停机时间,并提高系统的可用性和容错能力。

     需要特别注意的是,客观下线是主节点才有的概念:如果从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观下线和故障转移操作

    3.8、主节点的选举:

    1. .过滤掉不健康的 (已下线的),I没有回复哨兵 ping 响应的从节点。
    2. .选择配置文件中从节点优先级配置最高的。 (replica-priority,默认值为100)
    3. .选择复制偏移量最大,也就是复制最完整的从节点。

     哨兵的启动依赖于主从模式,所以须把主从模式安装好的情况下再去做哨兵模式

    哨兵模式是一种用于高可用性的Redis分布式架构。在哨兵模式中,有多个Redis节点,其中一个被选举为主节点(master),其他节点则作为从节点(slave)。当主节点发生故障时,哨兵会自动选举出新的主节点。

    3.9、主节点选举原则:

    1. 哨兵的数量:至少需要3个哨兵来进行主节点选举,以确保容错性和可靠性。
    2. 选举触发条件:在以下情况下,哨兵会触发主节点选举:
       - 当前主节点无法连接或宕机;
       - 哨兵与主节点失去联系超过指定的时间;
       - 从节点数量不足以满足最小副本要求。
    3. 选举过程:
       - 当哨兵检测到主节点故障后,它会通过互相通信进行选举协商。
       - 所有哨兵都会提供自己认为合适的主节点候选人,并通过投票方式选择。
       - 如果某个候选人获得了超过半数以上的选票,那么该节点就会成为新的主节点。
       - 如果没有候选人获得多数选票,那么重新进行选举,直到达成一致。
    4. 选举结果通知:一旦选出新的主节点,哨兵会将这一信息广播给所有从节点,使其切换到新的主节点。

    需要注意的是,在哨兵模式下,主节点选举是自动进行的,无需人工干预。选举过程中的具体细节和配置参数可以根据实际需求进行设置和调整。

    3.10、哨兵模式流程:

    哨兵模式是一种用于高可用性的Redis分布式架构。它通过监控和管理多个Redis节点,实现主节点故障自动转移和故障恢复。以下是哨兵模式的基本流程:

    1. 配置哨兵:

    在启动哨兵之前,需要进行相应的配置。配置包括指定哨兵的IP地址和端口、指定要监控的Redis节点信息等。

    2. 启动哨兵:

    启动配置好的哨兵进程,在指定的IP地址和端口上监听客户端请求,并开始监控Redis节点的状态。

    3. 监控节点:

    哨兵通过周期性地向被监控的Redis节点发送ping命令来监控节点的健康状态。如果一个节点无法正常响应或超过一定时间没有心跳信号,那么该节点被判定为不可用。

    4. 故障检测与转移:
       - 当哨兵检测到主节点不可用时,它会根据预定义的规则触发故障转移过程。
       - 哨兵会从剩余的可用从节点中选出一个作为新的主节点,并将其切换为主节点。
       - 哨兵还会将其他从节点重新配置为从属于新的主节点,并通知客户端进行更新。

    5. 客户端重定向:

    一旦故障转移完成,哨兵会向客户端发送一个特殊的重定向命令,告知其新的主节点地址。客户端收到重定向命令后,将请求发送到新的主节点。

    6. 故障恢复:
       - 当主节点恢复正常并重新加入集群时,它将成为从节点,并与新的主节点进行数据同步。
       - 哨兵可以自动将原来的主节点重新配置为从节点,并恢复整个Redis集群的正常运行状态。

    通过上述流程,哨兵模式可以实现Redis的高可用性和故障恢复能力,确保在主节点故障时自动切换到备用节点,并在主节点恢复时恢复正常的主从关系。

    3.11、搭建Redis 哨兵模式以及故障模拟

    在主从复制的基础上进行配置

    -修改 Redis 哨兵模式的配置文件(所有节点操作)

    1. vim /opt/redis-5.0.7/sentinel.conf
    2. protected-mode no #17行,关闭保护模式
    3. port 26379 #21行,Redis哨兵默认的监听端口
    4. daemonize yes #26行,指定sentinel为后台启动
    5. logfile "/var/log/sentinel.log" #36行,指定日志存放路径
    6. dir "/var/lib/redis/6379" #65行,指定数据库存放路径
    7. sentinel monitor mymaster 192.168.10.23 6379 2 #84行,修改 指定该哨兵节点监控192.168.10.23:6379这个主节点,该主节点的名称是mymaster,最后的2的含义与主节点的故障判定有关:至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移
    8. sentinel down-after-milliseconds mymaster 30000 #113行,判定服务器down掉的时间周期,默认30000毫秒(30秒)
    9. sentinel failover-timeout mymaster 180000 #146行,故障节点的最大超时时间为180000180秒)

    protected-mode no #17行,关闭保护模式
    port 26379 #21行,Redis哨兵默认的监听端口
    daemonize yes #26行,指定sentinel为后台启动

    36行,指定日志存放路径

    65行,指定数据库存放路径

    84行,修改 指定该哨兵节点监控

    113行,判定服务器down掉的时间周期,默认30000毫秒(30秒)

    146行,故障节点的最大超时时间为180000(180秒)

    先启master,再启slave

    启动完成

    哨兵测试

    1. -----启动哨兵模式-----
    2. 先启master,再启slave
    3. cd /opt/redis-5.0.7/
    4. redis-sentinel sentinel.conf &
    5. -----查看哨兵信息-----
    6. redis-cli -p 26379 info Sentinel
    7. lsof -i:26379

    故障模拟

    -----故障模拟----- #查看redis-server进程号:

    ps -ef | grep redis

     

    指定的哨兵为41.21

    将哨兵的进程杀掉

    主变成了192.168.41.22

    查看哨兵的信息以更改

    4、集群

    4.1、概述

    集群,即Redis Cluster,是Redis 3.0开始引入的分布式存储方案

    寒群由多个节点 d)组成,Redis的数据分布在这些节点中。集群中的节点分为主节点和从节点:只有主节点负责读写请求和集群信息的维护,从节点只进行主节点教据和状态信息的复制

    4.2、集群的作用

    集群的作用,可以归纳为两点:

    1、数据分区:数据分区(或称数据分片)是集群最核心的功能。集群将数据分散到多个节点,方面突破了Redis单机内存大小的限制,存储容量大大增加,另一方面每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力

    2、高可用:集群支持主从复制和主节点的自动故障转移(与哨兵类似);当任一节点发生故障时,集群仍然可以对外提供服务。

    4.3、Redis集群的数据分片:

    Redis集群引入了哈希槽的概念

    Redis集群有16384个哈希槽(编号0-16383)

    集群的每个节点负责一部分哈希槽

    每个Key通过CRC16校验后对16384取余来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存取操作

     以3个节点组成的集群为例:

    节点A包含0到5460号哈希槽

    节点B包含5461到10922号哈希槽

    节点C包含10923到16383号哈希槽

     Redis集群的主从复制模型

    集群中具有A、B、C三个节点,如果节点B失败了,整个集群就会因缺少5461-10922这个范围的槽而不可以用。

    为每个节点添加一个从节点A1、B1、C1整个集群便有三个Master节点和三个slave节点组成,在节点B失败后,集群选举B1位为的主节点继续服务。当B和B1都失败后,集群将不可用。

     

     

    4.4、  搭建Redis 群集模式

    这里所有节点在同一台服务器上模拟: 以端口号进行区分:3个主节点端口号:6001/6002/6003,对应的从节点端口号:6004/6005/6006。

    1. cd /etc/redis/
    2. mkdir -p redis-cluster/redis600{1..6}
    3. for i in {1..6}
    4. do
    5. cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis600$i
    6. cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis600$i
    7. done

     后面五个没有进行脚本最简单的复制,改一下数据

    开启群集功能:

    其他5个文件夹的配置文件以此类推修改,注意6个端口都要不一样。

    1. cd /etc/redis/redis-cluster/redis6001
    2. vim redis.conf
    3. #bind 127.0.0.1 #69行,注释掉bind 项,默认监听所有网卡
    4. protected-mode no #88行,修改,关闭保护模式
    5. port 6001 #92行,修改,redis监听端口,
    6. daemonize yes #136行,开启守护进程,以独立进程启动
    7. cluster-enabled yes #832行,取消注释,开启群集功能
    8. cluster-config-file nodes-6001.conf #840行,取消注释,群集名称文件设置
    9. cluster-node-timeout 15000 #846行,取消注释群集超时时间设置
    10. appendonly yes #700行,修改,开启AOF持久化

     监听地址如果想用自己的,需要添加

     关闭保护模式

    redis监听端口进行修改

    开启守护进程

    开启AOF持久化

    取消注释开启集群功能

    取消注释,设置集群超时时间

     启动redis节点

    分别进入那六个文件夹,执行命令:redis-server redis.conf ,来启动redis节点

    1. cd /etc/redis/redis-cluster/redis6001
    2. redis-server redis.conf
    3. for d in {1..6}
    4. do
    5. cd /etc/redis/redis-cluster/redis600$d
    6. redis-server redis.conf
    7. done
    8. ps -ef | grep redis

    启动集群

    redis-cli --cluster create 127.0.0.1:6001 127.0.0.1:6002 127.0.0.1:6003 127.0.0.1:6004 127.0.0.1:6005 127.0.0.1:6006 --cluster-replicas 1
    

    1. 127.0.0.1:6001> set name zhangsan
    2. -> Redirected to slot [5798] located at 127.0.0.1:6003
    3. OK
    4. 127.0.0.1:6001> cluster keyslot name #查看name键的槽编号
    5. redis-cli -p 6004 -c
    6. 127.0.0.1:6004> keys * #对应的slave节点也有这条数据,但是别的节点没有
    7. 1) "name"

  • 相关阅读:
    打造生产级Llama大模型服务
    openharmony容器组件之Panel
    认识和使用差分数组
    记账工具:轻松添加新账户并记录明细
    【NeurIPS 2023】Backdoor对抗攻防论文汇总
    【NLP】AI相关比赛汇总(2022)
    Chapter20: Machine Learning for In Silico ADMET Prediction
    start()方法源码分析
    北斗导航 | 最小二乘模糊度估计方法(LSAR:Least Squares Ambiguity Resolution)
    【机器学习 复习】第6章 支持向量机(SVM)
  • 原文地址:https://blog.csdn.net/Breeze_nebula/article/details/132738510