• SpringCloud基础7——Redis分布式缓存


      导航:

    【黑马Java笔记+踩坑汇总】JavaSE+JavaWeb+SSM+SpringBoot+瑞吉外卖+SpringCloud/SpringCloudAlibaba+黑马旅游+谷粒商城

    目录

    1.Redis持久化

    1.0.Redis持久化的意义 

    1.1.数据备份文件RDB持久化方案

    1.1.1.执行时机

    1.1.2.RDB原理

    1.1.3.小结,bgsave流程、执行时间、缺点

    1.2.追加文件AOF持久化方案

    1.2.1.AOF原理

    1.2.2.AOF配置

    1.2.3.AOF文件重写

    1.3.RDB与AOF对比

    2.Redis主从

    2.0.介绍

    2.1.搭建主从集群

    2.1.1.集群结构

    2.1.2.准备实例和配置

    2.1.3.启动

    2.1.4.开启主从关系

    2.1.5.测试读写分离

    2.2.主从数据同步原理

    2.2.1.全量同步

    2.2.2.增量同步

    2.2.3.repl_backlog原理

    2.3.主从同步优化

    2.4.小结,全量同步和增量同步区别、执行时间

    3.Redis哨兵

    3.1.哨兵原理

    3.1.1.集群结构和作用

    3.1.2.集群监控原理

    3.1.3.集群故障恢复原理,选举、切换新master

    3.1.4.小结,Sentinel健康、故障转移、通知

    3.2.搭建哨兵集群

    3.2.1.集群结构

    3.2.2.准备实例和配置

    3.2.3.启动3个redis实例

    3.2.4.测试

    3.3.RedisTemplate

    3.3.1.导入Demo工程

    3.3.2.引入redis的starter依赖

    3.3.3.配置Redis地址

    3.3.4.配置读写分离

    3.3.5.测试读写分离、主从自动切换

    4.Redis分片集群

    4.0.分片集群概述

    4.1.搭建分片集群 

    4.1.1.集群结构

    4.1.2.准备实例和配置

    4.1.3.启动

    4.1.4.创建集群

    4.1.5.集群常用命令

    4.1.6.集群模式下连接节点必须加“-c”

    4.2.散列插槽

    4.2.1.插槽原理

    4.2.1.小结,插槽流程、同类数据通过{}插槽绑定到同实例

    4.3.集群伸缩

    4.3.0.操作集群的命令 

    4.3.1.需求分析,添加节点到集群、分配插槽

    4.3.2.创建新的redis实例

    4.3.3.添加新节点到redis

    4.3.4.转移插槽

    4.4.故障转移

    4.4.1.自动故障转移

    4.4.2.手动故障转移、指定master实例

    4.5.RedisTemplate访问分片集群


    1.Redis持久化

    1.0.Redis持久化的意义 

    redis持久化的意义,在于数据备份和故障恢复

    比如你部署了一个redis,作为cache缓存,当然也可以保存一些较为重要的数据。Redis数据存在内容中,如果没有持久化的话,redis遇到灾难性故障的时候,就会丢失所有的数据。如果通过将数据持久化在磁盘上,然后定期同步和备份到一些云存储服务上去,那么就可以保证数据不丢失全部,还是可以恢复一部分数据回来的。

    redis持久化+ 备份:一般将redis数据从内存存储到磁盘。然后将磁盘数据备份一份即将数据上传到云服务器S3 或 ODPS上即可。如果左边的redis进程坏了并且磁盘也坏了,此时可以在另一台服务器启动该redis,然后将云服务器上的数据copy一份到磁盘上,redis进程在启动过程中会从磁盘加载到内存中。

    Redis有两种持久化方案:

    • RDB持久化
    • AOF持久化

    1.1.数据备份文件RDB持久化方案

    RDB全称Redis Database Backup file(Redis数据备份文件,backup译为备份,支援,也被叫做Redis数据快照。简单来说就是把内存中的所有数据都记录到磁盘中。当Redis实例故障重启后,从磁盘读取快照文件,恢复数据。快照文件称为RDB文件,默认是保存在当前运行目录

    1.1.1.执行时机

    RDB持久化在四种情况下会执行:

    • 执行save命令
    • 执行bgsave命令
    • Redis停机时
    • 触发RDB条件时

    1)save命令

    执行下面的命令,可以立即执行一次RDB:

    image-20210725144536958

    save命令会导致主进程执行RDB,这个过程中其它所有命令都会被阻塞。只有在数据迁移时可能用到。

    2)bgsave命令

    下面的命令可以异步执行RDB:

    image-20210725144725943

    这个命令执行后会开启独立进程完成RDB主进程可以持续处理用户请求,不受影响

    3)停机时

    Redis停机时会执行一次save命令,实现RDB持久化。

    4)触发RDB条件

    Redis内部有触发RDB的机制,可以在redis.conf文件中找到,格式如下:

    1. cd /usr/local/redis-4.0.0
    2. vim redis.conf

    1. # 900秒内,如果至少有1个key被修改,则执行bgsave , 如果是save "" 则表示禁用RDB
    2. save 900 1
    3. save 300 10
    4. save 60 10000

    redis服务端自动RDB: 

     RDB的其它配置也可以在redis.conf文件中设置: 

    1. # 是否压缩 ,建议不开启,压缩也会消耗cpu,磁盘的话不值钱
    2. rdbcompression yes
    3. # RDB文件名称
    4. dbfilename dump.rdb
    5. # 文件保存的路径目录
    6. dir ./

    1.1.2.RDB原理

    bgsave开始时会fork主进程得到子进程子进程共享主进程的内存数据。完成fork后读取内存数据并写入 RDB 文件。在fork时主进程是阻塞的。

    fork采用的是copy-on-write技术:

    • 当主进程执行读操作时,访问共享内存。在linux中,主进程只能操作虚拟内存,不能操作物理内存,操作系统会维护虚拟内存到物理内存的映射关系表(即页表)。当进行写操作时,物理内存会拷贝数据副本,主进程在数据副本实行读写。
    • 当主进程执行写操作时,则会拷贝一份页表到子进程,实现了内存空间共享,根据页表的映射关系执行写操作。

    image-20210725151319695

    1.1.3.小结,bgsave流程、执行时间、缺点

    RDB方式bgsave的基本流程?

    • fork主进程得到一个子进程,共享内存空间
    • 子进程读取内存数据并写入新的RDB文件
    • 用新RDB文件替换旧的RDB文件

    RDB会在什么时候执行?save 60 1000代表什么含义?

    • 默认是服务停止时
    • 代表60秒内至少执行1000次修改则触发RDB

    RDB的缺点?

    • RDB执行间隔时间长两次RDB之间写入数据有丢失的风险
    • fork子进程、压缩、写出RDB文件都比较耗时

    1.2.追加文件AOF持久化方案

    1.2.1.AOF原理

    AOF全称为Append Only File(追加文件)Redis处理的每一个写命令都会记录在AOF文件,可以看做是命令日志文件

    image-20210725151543640

    1.2.2.AOF配置

    AOF默认是关闭的,需要修改redis.conf配置文件来开启AOF:

    1. # 是否开启AOF功能,默认是no
    2. appendonly yes
    3. # AOF文件的名称
    4. appendfilename "appendonly.aof"

    AOF的命令记录的频率也可以通过redis.conf文件来配:

    1. # 表示每执行一次写命令,立即记录到AOF文件。牺牲性能绝对保证数据安全性
    2. #appendfsync always
    3. # 默认。写命令执行完先放入AOF缓冲区,然后表示每隔1秒将缓冲区数据写到AOF文件,是默认方案。内存方式读写,对性能有帮助,最多会丢失一秒钟内数据
    4. appendfsync everysec
    5. # 写命令执行完先放入AOF缓冲区,由操作系统决定何时将缓冲区内容写回磁盘。安全性最差,还不如RDB用快照文件存读数据安全。
    6. #appendfsync no

    三种策略对比:

    image-20210725151654046

    实现AOF:

    redis.conf先禁用RDB、删除RDB文件:

     

     配置AOF:

     存数据:

    出现了aof文件 

    aof是记录所有命令、rdb是记录各记录的值,所以aof文件会比rdb文件大很多。 

    1.2.3.AOF文件重写

    因为是记录命令AOF文件会比RDB文件大的多。而且AOF会记录对同一个key的多次写操作,但只有最后一次写操作才有意义。通过执行bgrewriteaof命令,可以让AOF文件执行重写功能,用最少的命令达到相同效果。

     如图,AOF原本有三个命令,但是set num 123 和 set num 666都是对num的操作,第二次会覆盖第一次的值,因此第一个命令记录下来没有意义。

    所以重写命令后,AOF文件内容就是:mset name jack num 666

    Redis也会在触发阈值自动去重写AOF文件。阈值也可以在redis.conf中配置:

    1. # AOF文件比上次文件 增长超过多少百分比则触发重写
    2. auto-aof-rewrite-percentage 100
    3. # AOF文件体积最小多大以上才触发重写
    4. auto-aof-rewrite-min-size 64mb

    1.3.RDB与AOF对比

    RDB和AOF各有自己的优缺点,如果对数据安全性要求较高,在实际开发中往往会结合两者来使用。

    image-20210725151940515

    数据恢复优先级是两个方案同时用会优先使用aof文件恢复。 

    2.Redis主从

    2.0.介绍

    主从的好处: 

    1. 数据备份,主从复制实现了数据的热备,是除了持久化机制之外的另外一种数据备份方式。
    2. 读写分离,使数据库能支撑更大的并发。在报表中尤其重要。由于部分报表sql语句非常的慢,导致锁表,影响前台服务。如果前台使用master,报表使用slave,那么报表sql将不会造成前台锁,保证了前台速度。
    3. 负载均衡,在主从复制的基础上,配合读写分离机制,可以由主节点提供写服务,从节点提供服务。在读多写少的场景中,可以增加从节点来分担redis-server读操作的负载能力,从而大大提高redis-server的并发量
    4. 保证高可用,作为后备数据库,如果主节点出现故障后,可以切换到从节点继续工作,保证redisserver的高可用。

    2.1.搭建主从集群

    2.1.1.集群结构

    我们搭建的主从集群结构如图:

    image-20210630111505799

    共包含三个节点,一个主节点,两个从节点。

    这里我们会在同一台虚拟机中开启3个redis实例,模拟主从集群,信息如下:

    IPPORT角色
    192.168.150.1017001master
    192.168.150.1017002slave
    192.168.150.1017003slave

    2.1.2.准备实例和配置

    要在同一台虚拟机开启3个实例,必须准备三份不同的配置文件和目录,配置文件所在目录也就是工作目录。

    1)创建目录

    我们在Linux的tmp目录下创建三个文件夹,名字分别叫7001、7002、7003:

    1. # 进入/tmp目录
    2. cd /tmp
    3. # 创建目录
    4. mkdir 7001 7002 7003

    如图:

    image-20210630113929868

    2)恢复原始配置

    修改redis-6.2.4/redis.conf文件,将其中的持久化模式改为默认的RDB模式AOF保持关闭状态

    1. # 开启RDB
    2. # save ""
    3. save 3600 1
    4. save 300 100
    5. save 60 10000
    6. # 关闭AOF
    7. appendonly no

    3)拷贝配置文件到每个实例目录

    然后将redis-6.2.4/redis.conf文件拷贝到三个目录中(在/tmp目录执行下列命令):

    1. # 方式一:逐个拷贝
    2. cp redis-6.2.4/redis.conf 7001
    3. cp redis-6.2.4/redis.conf 7002
    4. cp redis-6.2.4/redis.conf 7003
    5. # 方式二:管道组合命令,一键拷贝
    6. #echo 7001 7002 7003 | xargs -t -n 1 cp redis-6.2.4/redis.conf

    4)修改每个实例的端口、工作目录

    修改每个文件夹内的配置文件,将端口分别修改为7001、7002、7003,将rdb文件保存位置都修改为自己所在目录(在/tmp目录执行下列命令):

    1. sed -i -e 's/6379/7001/g' -e 's/dir .\//dir \/tmp\/7001\//g' 7001/redis.conf
    2. sed -i -e 's/6379/7002/g' -e 's/dir .\//dir \/tmp\/7002\//g' 7002/redis.conf
    3. sed -i -e 's/6379/7003/g' -e 's/dir .\//dir \/tmp\/7003\//g' 7003/redis.conf

    sed是快捷的对文档操作的命令。 

    5)修改每个实例的声明IP

    虚拟机本身有多个IP,为了避免将来混乱,我们需要在redis.conf文件中指定每一个实例的绑定ip信息,格式如下:

    1. # redis实例的声明 IP
    2. replica-announce-ip 192.168.150.101

    每个目录都要改,我们一键完成修改(在/tmp目录执行下列命令):

    1. # 逐一执行
    2. sed -i '1a replica-announce-ip 192.168.150.101' 7001/redis.conf
    3. sed -i '1a replica-announce-ip 192.168.150.101' 7002/redis.conf
    4. sed -i '1a replica-announce-ip 192.168.150.101' 7003/redis.conf
    5. # 或者一键修改
    6. #printf '%s\n' 7001 7002 7003 | xargs -I{} -t sed -i '1a replica-announce-ip 192.168.150.101' {}/redis.conf

    2.1.3.启动

    为了方便查看日志,我们打开3个ssh窗口,分别启动3个redis实例,启动命令:

    1. # 第1个
    2. redis-server 7001/redis.conf
    3. # 第2个
    4. redis-server 7002/redis.conf
    5. # 第3个
    6. redis-server 7003/redis.conf

    启动后:

    image-20210630183914491

    如果要一键停止,可以运行下面命令:

    printf '%s\n' 7001 7002 7003 | xargs -I{} -t redis-cli -p {} shutdown
    

    2.1.4.开启主从关系

    现在三个实例还没有任何关系,要配置主从可以使用replicaof 或者slaveof(5.0以前)命令

    有临时和永久两种模式:

    • 修改配置文件(永久生效)

      • 在redis.conf中添加一行配置:slaveof
    • 使用redis-cli客户端连接到redis服务,执行slaveof命令(重启后失效):

      slaveof 主机ip地址 主机端口
      

    注意:在5.0以后新增命令replicaof,与salveof效果一致。

    这里我们为了演示方便,使用方式二命令行

    通过redis-cli命令连接7002,执行下面命令:

    1. # 连接 7002
    2. redis-cli -p 7002
    3. # 执行slaveof,将7002的主机设为7001
    4. slaveof 192.168.150.101 7001

    通过redis-cli命令连接7003,执行下面命令:

    1. # 连接 7003
    2. redis-cli -p 7003
    3. # 执行slaveof
    4. slaveof 192.168.150.101 7001

    然后连接 7001节点,查看集群状态:

    1. # 连接 7001
    2. redis-cli -p 7001
    3. # 查看状态
    4. info replication

    结果:查看7001的从库:

    image-20210630201258802

    2.1.5.测试读写分离

    执行下列操作以测试:

    • 利用redis-cli连接主库7001,执行set num 123

    • 利用redis-cli连接7002,执行get num,再执行set num 666

    • 利用redis-cli连接7003,执行get num,再执行set num 888。发现只能读不能写。

    可以发现,只有在7001这个master节点上可以执行写操作,7002和7003这两个slave节点只能执行读操作。

    2.2.主从数据同步原理

    2.2.1.全量同步

    主从第一次建立连接时,会执行全量同步,将master节点的所有数据都拷贝给slave节点,流程:

    image-20210725152222497

    repl_backlog译为复制积压文件,底层是双向链表,存储发送rdb文件和加载rdb文件期间的所有命令。确保主从库永远一致。

    这里有一个问题,master如何得知salve是第一次来连接呢?

    有几个概念,可以作为判断依据:

    • Replication Id:简称replid,是数据集的标记,id一致则说明是同一数据集。每一个master都有唯一的replid,slave在第一次同步时两者replid不同,要做全量同步从库会继承master节点的replid;以后同步两者replid相同,是同一数据集,做增量同步。replication译为复制、重复。
    • offset偏移量随着记录在repl_backlog中的数据增多而逐渐增大。slave完成同步时也会记录当前同步的offset。如果slave的offset小于master的offset,说明slave数据落后于master,需要更新

    因此slave做数据同步,必须向master声明自己的replication id 和offset,master才可以判断到底需要同步哪些数据。

    因为slave原本也是一个master,有自己的replid和offset,当第一次变成slave,与master建立连接时,发送的replid和offset是自己的replid和offset。

    master判断发现slave发送来的replid与自己的不一致,说明这是一个全新的slave,就知道要做全量同步了。

    master会将自己的replid和offset都发送给这个slave,slave保存这些信息。以后slave的replid就与master一致了。

    因此,master判断一个节点是否是第一次同步的依据,就是看replid是否一致

    如图:

    image-20210725152700914

    完整流程描述:

    • slave节点请求增量同步
    • master节点判断replid,发现不一致,拒绝增量同步
    • master将完整内存数据生成RDB,发送RDB到slave
    • slave清空本地数据,加载master的RDB
    • master将RDB期间的命令记录在repl_backlog,并持续将log中的命令发送给slave
    • slave执行接收到的命令,保持与master之间的同步

    2.2.2.增量同步

    全量同步需要先做RDB,然后将RDB文件通过网络传输个slave,成本太高了。因此除了第一次做全量同步,其它大多数时候slave与master都是做增量同步

    什么是增量同步?就是根据偏移量offset只更新slave与master存在差异的部分数据。如图:

    image-20210725153201086

    那么master怎么知道slave与自己的数据差异在哪里呢?

    2.2.3.repl_backlog原理

    master怎么知道slave与自己的数据差异在哪里呢?

    这就要说到全量同步时的repl_backlog文件了。

    这个文件是一个循环链表,也就是说角标到达链表末尾后,会再次从0开始读写,这样数组头部的数据就会被覆盖。

    repl_backlog中会记录Redis处理过的命令日志及offset,包括master当前的offset,和slave已经拷贝到的offset:

    image-20210725153359022

    slave与master的offset之间的差异,就是salve需要增量拷贝的数据了。

    随着不断有数据写入,master的offset逐渐变大,slave也不断的拷贝,追赶master的offset:

    image-20210725153524190

    直到链表被填满:

    image-20210725153715910

    此时,如果有新的数据写入,就会覆盖链表中的旧数据。不过,旧的数据只要是绿色的,说明是已经被同步到slave的数据,即便被覆盖了也没什么影响。因为未同步的仅仅是红色部分。

    但是,如果slave出现网络阻塞,导致master的offset远远超过了slave的offset:

    image-20210725153937031

    如果master继续写入新数据,其offset就会覆盖旧的数据,直到将slave现在的offset也覆盖:

    image-20210725154155984

    棕色框中的红色部分,就是尚未同步,但是却已经被覆盖的数据。此时如果slave恢复,需要同步,却发现自己的offset都没有了,无法完成增量同步了。只能做全量同步。

    image-20210725154216392

    2.3.主从同步优化

    主从同步可以保证主从数据的一致性,非常重要。

    可以从以下几个方面来优化Redis主从就集群:

    • 在master中配置repl-diskless-sync yes启用无磁盘复制避免全量同步时的磁盘IO。
    • Redis单节点上的内存占用不要太大,减少RDB导致的过多磁盘IO
    • 适当提高repl_backlog的大小,发现slave宕机时尽快实现故障恢复,尽可能避免全量同步
    • 限制一个master上的slave节点数量,如果实在是太多slave,则可以采用主-从-从链式结构,减少master压力

    主从从架构图:

    image-20210725154405899

    2.4.小结,全量同步和增量同步区别、执行时间

    简述全量同步和增量同步区别?

    • 全量同步:master将完整内存数据生成RDB,发送RDB到slave。后续命令则记录在repl_backlog,逐个发送给slave。
    • 增量同步:slave提交自己的offset到master,master获取repl_backlog中从offset之后的命令给slave

    什么时候执行全量同步?

    • slave节点第一次连接master节点时
    • slave节点断开时间太久,repl_backlog中的offset已经被覆盖时

    什么时候执行增量同步?

    • slave节点断开又恢复,并且在repl_backlog中能找到offset时

    3.Redis哨兵

    Redis提供了哨兵(Sentinel)机制来实现主从集群的自动故障恢复。

    3.1.哨兵原理

    3.1.1.集群结构和作用

    哨兵的结构如图:

    image-20210725154528072

    哨兵的作用如下:

    • 监控:Sentinel 会不断检查您的master和slave是否按预期工作
    • 自动故障恢复:如果master故障,Sentinel会将一个slave提升为master。当故障实例恢复后也以新的master为主
    • 通知:Sentinel充当Redis客户端的服务发现来源,当集群发生故障转移时,会将最新信息推送给Redis的客户端

    3.1.2.集群监控原理

    Sentinel基于心跳机制监测服务状态每隔1秒向集群的每个实例发送ping命令

    •主观下线:如果某sentinel节点发现某实例未在规定时间响应,则认为该实例主观下线

    •客观下线:超过指定数量quorum值(quorum译为法定人数、多数派)的sentinel认为该实例主观下线,则该实例客观下线。quorum值最好超过Sentinel实例数量的一半。

    image-20210725154632354

    3.1.3.集群故障恢复原理,选举、切换新master

    1.选举新master的依据: 

    一旦发现master故障,sentinel需要在salve中选择一个作为新的master,选择依据是这样的:

    • 首先会判断slave节点与master节点断开时间长短,如果超过指定值(down-after-milliseconds * 10)则会排除该slave节点
    • 然后判断slave节点的slave-priority值,越小优先级越高,如果是0则永不参与选举
    • 如果slave-prority一样,则判断slave节点的offset值,越大说明数据越新,优先级越高
    • 最后是判断slave节点的运行id大小(这个运行id就很随机了,是Redis启动时自动生成的id),越小优先级越高。

    2.切换新master的方法: 

    • sentinel给备选的slave1节点发送slaveof no one命令,让该节点成为master
    • sentinel给所有其它slave发送slaveof 192.168.150.101 7002 命令,让这些slave成为新master的从节点,开始从新的master上同步数据。
    • 最后,sentinel将故障节点标记为slave,当故障节点恢复后会自动成为新的master的slave节点

    image-20210725154816841

    3.1.4.小结,Sentinel健康、故障转移、通知

    Sentinel对redis集群的三个作用是什么?

    • 监控
    • 故障转移
    • 通知

     Sentinel其他作用:

    微服务保护、流量控制、隔离和降级、授权规则、规则持久化

    Sentinel如何判断一个redis实例是否健康?

    • 每隔1秒发送一次ping命令,如果超过一定时间没有相向则认为是主观下线
    • 如果大多数sentinel都认为该实例主观下线,则判定该实例客观下线

    故障转移步骤有哪些?

    • 首先选定一个slave作为新的master,执行slaveof no one
    • 然后让所有节点都执行slaveof 新master
    • 修改故障的旧主节点配置,添加slaveof 新master

    3.2.搭建哨兵集群

    3.2.1.集群结构

    这里我们搭建一个三节点形成的Sentinel集群,来监管之前的Redis主从集群。如图:

    image-20210701215227018

    三个sentinel实例信息如下:

    节点IPPORT
    s1192.168.150.10127001
    s2192.168.150.10127002
    s3192.168.150.10127003

    3.2.2.准备实例和配置

    要在同一台虚拟机开启3个实例,必须准备三份不同的配置文件和目录,配置文件所在目录也就是工作目录。

    我们创建三个文件夹,名字分别叫s1、s2、s3:

    1. # 进入/tmp目录
    2. cd /tmp
    3. # 创建目录
    4. mkdir s1 s2 s3

    如图:

    image-20210701215534714

    然后我们在s1目录创建一个sentinel.conf文件,添加下面的内容:

    1. port 27001
    2. sentinel announce-ip 192.168.150.101
    3. #mymaster:主节点名称,自定义,任意写
    4. #192.168.150.101 7001:主节点的ip和端口
    5. #2:选举master时的quorum值,也就是3台实例超过两台被主观下线则整个redis集群客观下线。
    6. sentinel monitor mymaster 192.168.150.101 7001 2
    7. #Sentinel 在多长时间内没有从主服务器(mymaster)中收到响应时,将该主服务器视为不可用。
    8. sentinel down-after-milliseconds mymaster 5000
    9. #指定 Sentinel 在多长时间后将尝试执行故障转移以恢复故障
    10. sentinel failover-timeout mymaster 60000
    11. dir "/tmp/s1"

    解读:

    • port 27001:是当前sentinel实例的端口
    • sentinel monitor mymaster 192.168.150.101 7001 2:指定主节点信息,只指定主节点信息sentinel就能监控到整个集群
      • mymaster:主节点名称,自定义,任意写
      • 192.168.150.101 7001:主节点的ip和端口
      • 2选举master时的quorum值,也就是3台实例超过两台被主观下线则整个redis集群客观下线。

    然后将s1/sentinel.conf文件拷贝到s2、s3两个目录中(在/tmp目录执行下列命令):

    1. # 方式一:逐个拷贝
    2. cp s1/sentinel.conf s2
    3. cp s1/sentinel.conf s3
    4. # 方式二:管道组合命令,一键拷贝
    5. echo s2 s3 | xargs -t -n 1 cp s1/sentinel.conf

    修改s2、s3两个文件夹内的配置文件将端口分别修改为27002、27003:

    1. sed -i -e 's/27001/27002/g' -e 's/s1/s2/g' s2/sentinel.conf
    2. sed -i -e 's/27001/27003/g' -e 's/s1/s3/g' s3/sentinel.conf

    3.2.3.启动3个redis实例

    为了方便查看日志,我们打开3个ssh窗口,分别启动3个redis实例,启动命令:

    1. # 第1个
    2. redis-sentinel s1/sentinel.conf
    3. # 第2个
    4. redis-sentinel s2/sentinel.conf
    5. # 第3个
    6. redis-sentinel s3/sentinel.conf

    启动后:

    image-20210701220714104

    3.2.4.测试

    尝试让master节点7001宕机(ctrl+c),查看sentinel日志:认为主库主观下线

    image-20210701222857997

    查看7003的日志:认为主库主观下线

    image-20210701223025709

            也认为主库主观下线,超过2个实例认为7001主观下线,于是7001客观下线。7002被选成master、让其他实例认主

    image-20210701223131264

    超过2个sentinel认为主库7001主观下线了,那么认为7001客观下线,进行故障修复。

    3.3.RedisTemplate

    Sentinel集群监管下的Redis主从集群,其节点会因为自动故障转移而发生变化,Redis的客户端必须感知这种变化,及时更新连接信息。Spring的RedisTemplate底层利用lettuce实现了节点的感知和自动切换。

    下面,我们通过一个测试来实现RedisTemplate集成哨兵机制。

    3.3.1.导入Demo工程

    首先,我们引入课前资料提供的Demo工程:

    image-20210725155124958

    1. @RestController
    2. public class HelloController {
    3. @Autowired
    4. private StringRedisTemplate redisTemplate;
    5. @GetMapping("/get/{key}")
    6. public String hi(@PathVariable String key) {
    7. return redisTemplate.opsForValue().get(key);
    8. }
    9. @GetMapping("/set/{key}/{value}")
    10. public String hi(@PathVariable String key, @PathVariable String value) {
    11. redisTemplate.opsForValue().set(key, value);
    12. return "success";
    13. }
    14. }

    3.3.2.引入redis的starter依赖

    在项目的pom文件中引入依赖:

    1. <dependency>
    2. <groupId>org.springframework.boot</groupId>
    3. <artifactId>spring-boot-starter-data-redis</artifactId>
    4. </dependency>

    3.3.3.配置Redis地址

    然后在配置文件application.yml中指定redis下的sentinel相关信息,因为主库ip、端口、quorum值信息在sentinel的sentinel.conf里指定过了,所以只用配置sentinel的相关信息:

    1. spring:
    2. redis:
    3. sentinel:
    4. master: mymaster #与sentinel里的sentinel.conf配置文件的主库名一致
    5. nodes:
    6. - 192.168.150.101:27001
    7. - 192.168.150.101:27002
    8. - 192.168.150.101:27003

    我们以前在三个sentinel目录下都创建一个sentinel.conf文件,添加了下面的内容,指定了主库信息:

    1. port 27001
    2. sentinel announce-ip 192.168.150.101
    3. sentinel monitor mymaster 192.168.150.101 7001 2 #主节点名称,自定义,任意写
    4. sentinel down-after-milliseconds mymaster 5000
    5. sentinel failover-timeout mymaster 60000
    6. dir "/tmp/s1"

    3.3.4.配置读写分离

    在项目的启动类中,添加一个新的bean:

    1. @Bean
    2. public LettuceClientConfigurationBuilderCustomizer clientConfigurationBuilderCustomizer(){
    3. return clientConfigurationBuilder -> clientConfigurationBuilder.readFrom(ReadFrom.REPLICA_PREFERRED);
    4. }

    这个bean中配置的就是读写策略,包括四种:

    • MASTER:从主节点读取
    • MASTER_PREFERRED:优先从master节点读取,master不可用才读取replica
    • REPLICA:从slave(replica)节点读取
    • REPLICA _PREFERRED(推荐):优先从slave(replica)节点读取,所有的slave都不可用才读取master

    3.3.5.测试读写分离、主从自动切换

    测试读: 

    看idea日志:

    先获取sentinel连接

    挑中27001 

    得到主库信息: 

    得到从库信息: 

    连接主从节点: 

    可以看到查询请求给到了7003: 

    测试写:

    交给了7002主节点处理:

    测试故障修复:

    宕机7002 

    sentinel日志显示切换主节点到7001: 

    4.Redis分片集群

    4.0.分片集群概述

    主从和哨兵可以解决高可用、高并发读的问题。但是依然有两个问题没有解决:

    • 海量数据存储问题

    • 高并发写的问题

    使用分片集群可以解决上述问题,如图:

    image-20210725155747294

    分片集群特征:

    • 集群中有多个master,每个master保存不同数据

    • 每个master都可以有多个slave节点

    • master之间通过ping监测彼此健康状态

    • 客户端请求可以访问集群任意节点,最终都会被转发到正确节点

    4.1.搭建分片集群 

    4.1.1.集群结构

    分片集群需要的节点数量较多,这里我们搭建一个最小的分片集群,包含3个master节点,每个master包含一个slave节点,结构如下:

    image-20210702164116027

    这里我们会在同一台虚拟机中开启6个redis实例,模拟分片集群,信息如下:

    IPPORT角色
    192.168.150.1017001master
    192.168.150.1017002master
    192.168.150.1017003master
    192.168.150.1018001slave
    192.168.150.1018002slave
    192.168.150.1018003slave

    4.1.2.准备实例和配置

    删除之前的7001、7002、7003这几个目录,重新创建出7001、7002、7003、8001、8002、8003目录:

    1. # 进入/tmp目录
    2. cd /tmp
    3. # 删除旧的,避免配置干扰
    4. rm -rf 7001 7002 7003
    5. # 创建目录
    6. mkdir 7001 7002 7003 8001 8002 8003

    在/tmp下准备一个新的redis.conf文件,内容如下:

    1. port 6379
    2. # 开启集群功能
    3. cluster-enabled yes
    4. # 集群的配置文件名称,不需要我们创建,由redis自己维护
    5. cluster-config-file /tmp/6379/nodes.conf
    6. # 节点心跳失败的超时时间
    7. cluster-node-timeout 5000
    8. # 持久化文件存放目录
    9. dir /tmp/6379
    10. # 绑定地址
    11. bind 0.0.0.0
    12. # 让redis后台运行
    13. daemonize yes
    14. # 注册的实例ip
    15. replica-announce-ip 192.168.150.101
    16. # 保护模式
    17. protected-mode no
    18. # 数据库数量
    19. databases 1
    20. # 日志
    21. logfile /tmp/6379/run.log

    将这个文件拷贝到每个目录下:

    1. # 进入/tmp目录
    2. cd /tmp
    3. # 执行拷贝
    4. echo 7001 7002 7003 8001 8002 8003 | xargs -t -n 1 cp redis.conf

    修改每个目录下的redis.conf,将其中的6379修改为与所在目录一致:

    1. # 进入/tmp目录
    2. cd /tmp
    3. # 修改配置文件
    4. printf '%s\n' 7001 7002 7003 8001 8002 8003 | xargs -I{} -t sed -i 's/6379/{}/g' {}/redis.conf

    4.1.3.启动

    因为已经配置了后台启动模式,所以可以直接启动服务:

    1. # 进入/tmp目录
    2. cd /tmp
    3. # 一键启动所有服务
    4. printf '%s\n' 7001 7002 7003 8001 8002 8003 | xargs -I{} -t redis-server {}/redis.conf

    通过ps查看状态:

    ps -ef | grep redis
    

    发现服务都已经正常启动,此时互相之间还没有集群关系:

    image-20210702174255799

    如果要关闭所有进程,可以执行命令:

    ps -ef | grep redis | awk '{print $2}' | xargs kill
    

    或者(推荐这种方式):

    printf '%s\n' 7001 7002 7003 8001 8002 8003 | xargs -I{} -t redis-cli -p {} shutdown
    

    4.1.4.创建集群

    虽然服务启动了,但是目前每个服务之间都是独立的,没有任何关联。

    我们需要执行命令来创建集群,在Redis5.0之前创建集群比较麻烦,5.0之后集群管理命令都集成到了redis-cli中。

    1)Redis5.0之前

    Redis5.0之前集群命令都是用redis安装包下的src/redis-trib.rb来实现的。因为redis-trib.rb是有ruby语言编写的所以需要安装ruby环境。

    1. # 安装依赖
    2. yum -y install zlib ruby rubygems
    3. gem install redis

    然后通过命令来管理集群:

    1. # 进入redis的src目录
    2. cd /tmp/redis-6.2.4/src
    3. # 创建集群
    4. ./redis-trib.rb create --replicas 1 192.168.150.101:7001 192.168.150.101:7002 192.168.150.101:7003 192.168.150.101:8001 192.168.150.101:8002 192.168.150.101:8003

    2)Redis5.0以后

    我们使用的是Redis6.2.4版本,集群管理以及集成到了redis-cli中,格式如下:

    redis-cli --cluster create --cluster-replicas 1 192.168.150.101:7001 192.168.150.101:7002 192.168.150.101:7003 192.168.150.101:8001 192.168.150.101:8002 192.168.150.101:8003
    

    命令说明:

    • redis-cli --cluster或者./redis-trib.rb:代表集群操作命令
    • create:代表是创建集群
    • --replicas 1或者--cluster-replicas 1 :指定集群中每个master的副本个数为1,此时节点总数 ÷ (replicas + 1) 得到的就是master的数量。因此节点列表中的前n个就是master,其它节点都是slave节点,随机分配到不同master

    运行后的样子:

    image-20210702181101969

    这里输入yes,则集群开始创建:

    image-20210702181215705

    通过命令可以查看集群状态:

    redis-cli -p 7001 cluster nodes
    

    image-20210702181922809

    4.1.5.集群常用命令

    redis-cli --cluster命令:

    • redis-cli --cluster create:创建集群
    • info:查看集群状态
    • fix:修复集群
    • reshard:迁移插槽
    • add-node:添加新节点
    • del-node:删除指定节点
    • import:导入数据到集群
    1. redis-cli --cluster help
    2. Cluster Manager Commands:
    3. create host1:port1 ... hostN:portN #创建集群
    4. --cluster-replicas #从节点个数
    5. check host:port #检查集群
    6. --cluster-search-multiple-owners #检查是否有槽同时被分配给了多个节点
    7. info host:port #查看集群状态
    8. fix host:port #修复集群
    9. --cluster-search-multiple-owners #修复槽的重复分配问题
    10. reshard host:port #指定集群的任意一节点进行迁移slot,重新分slots
    11. --cluster-from #需要从哪些源节点上迁移slot,可从多个源节点完成迁移,以逗号隔开,传递的是节点的node id,还可以直接传递--from all,这样源节点就是集群的所有节点,不传递该参数的话,则会在迁移过程中提示用户输入
    12. --cluster-to #slot需要迁移的目的节点的node id,目的节点只能填写一个,不传递该参数的话,则会在迁移过程中提示用户输入
    13. --cluster-slots #需要迁移的slot数量,不传递该参数的话,则会在迁移过程中提示用户输入。
    14. --cluster-yes #指定迁移时的确认输入
    15. --cluster-timeout #设置migrate命令的超时时间
    16. --cluster-pipeline #定义cluster getkeysinslot命令一次取出的key数量,不传的话使用默认值为10
    17. --cluster-replace #是否直接replace到目标节点
    18. rebalance host:port #指定集群的任意一节点进行平衡集群节点slot数量 
    19. --cluster-weight #指定集群节点的权重
    20. --cluster-use-empty-masters #设置可以让没有分配slot的主节点参与,默认不允许
    21. --cluster-timeout #设置migrate命令的超时时间
    22. --cluster-simulate #模拟rebalance操作,不会真正执行迁移操作
    23. --cluster-pipeline #定义cluster getkeysinslot命令一次取出的key数量,默认值为10
    24. --cluster-threshold #迁移的slot阈值超过threshold,执行rebalance操作
    25. --cluster-replace #是否直接replace到目标节点
    26. add-node new_host:new_port existing_host:existing_port #添加节点,把新节点加入到指定的集群,默认添加主节点
    27. --cluster-slave #新节点作为从节点,默认随机一个主节点
    28. --cluster-master-id #给新节点指定主节点
    29. del-node host:port node_id #删除给定的一个节点,成功后关闭该节点服务
    30. call host:port command arg arg .. arg #在集群的所有节点执行相关命令
    31. set-timeout host:port milliseconds #设置cluster-node-timeout
    32. import host:port #将外部redis数据导入集群
    33. --cluster-from #将指定实例的数据导入到集群
    34. --cluster-copy #migrate时指定copy
    35. --cluster-replace #migrate时指定replace
    36. help
    37. For check, fix, reshard, del-node, set-timeout you can specify the host and port of any working node in the cluster.

    4.1.6.集群模式下连接节点必须加“-c”

    集群模式下,连接节点时必须加“-c” 。例如

    redis-cli -c -p 7001

    尝试连接7001节点,存储一个数据:

    1. # 连接
    2. redis-cli -p 7001
    3. # 存储数据
    4. set num 123
    5. # 读取数据
    6. get num
    7. # 再次存储
    8. set a 1

    结果悲剧了:

    image-20210702182343979

    集群操作时,需要给redis-cli加上-c参数才可以:

    redis-cli -c -p 7001
    

    这次可以了:

    image-20210702182602145

    4.2.散列插槽

    4.2.1.插槽原理

    Redis会把每一个master节点映射到0~16383共16384个插槽(hash slot)上,查看集群信息时就能看到:

    image-20210725155820320

    数据key不是与节点绑定,而是与插槽绑定。redis会根据key的有效部分计算插槽值,分两种情况:

    • key中包含"{}",且“{}”中至少包含1个字符,“{}”中的部分是有效部分
    • key中不包含“{}”整个key都是有效部分

    例如:key是num,那么就根据num计算,如果是{itcast}num,则根据itcast计算。计算方式是利用CRC16算法得到一个hash值,然后对16384取余,得到的结果就是slot值。

    注意,集群下打开redis客户端要加-c 

    如图,在7001这个节点执行set a 1时,对a做hash运算,对16384取余,得到的结果是15495,因此要存储到103节点。

    到了7003节点后,执行get num时,对num做hash运算,对16384取余,得到的结果是2765,因此需要切换到7001节点

    4.2.1.小结,插槽流程、同类数据通过{}插槽绑定到同实例

    Redis如何判断某个key应该在哪个实例?

    • 将16384个插槽分配到不同的实例
    • 根据key的有效部分计算哈希值,对16384取余
    • 余数作为插槽,寻找插槽所在实例即可

    如何将同一类数据固定的保存在同一个Redis实例?

    • 这一类数据使用相同的有效部分,例如key都以{typeId}为前缀,有效值一样的key会存储在同一个插槽。

     例如将num存到a所在插槽:

    4.3.集群伸缩

    4.3.0.操作集群的命令 

    redis-cli --cluster提供了很多操作集群的命令,可以通过下面方式查看:

    image-20210725160138290

    比如,添加节点的命令:

    image-20210725160448139

    1. redis-cli --cluster add-node 192.168.150.101:7004 192.168.150.101:7001
    2. #后面这个ip:端口是集群中任意已存在的实例地址

    插槽命令: 

    4.3.1.需求分析,添加节点到集群、分配插槽

    需求:向集群中添加一个新的master节点,并向其中存储 num = 10

    • 启动一个新的redis实例,端口为7004
    • 添加7004到之前的集群,并作为一个master节点
    • 给7004节点分配插槽使得num这个key可以存储到7004实例(num插槽算出来在7001)

    这里需要两个新的功能:

    • 添加一个节点到集群中
    • 将部分插槽分配到新插槽

    4.3.2.创建新的redis实例

    创建一个文件夹:

    mkdir 7004
    

    拷贝配置文件:

    cp redis.conf /7004
    

    修改配置文件:

    sed /s/6379/7004/g 7004/redis.conf
    

    启动7004

    redis-server 7004/redis.conf
    

    4.3.3.添加新节点到redis

    添加节点的语法如下:

    image-20210725160448139

    执行添加新节点命令:

    1. redis-cli --cluster add-node 192.168.150.101:7004 192.168.150.101:7001
    2. #后面这个ip:端口是集群中任意已存在的实例地址

    通过命令查看集群状态:

    redis-cli -p 7001 cluster nodes
    

    如图,7004加入了集群,并且默认是一个master节点:

    image-20210725161007099

    但是,可以看到7004节点的插槽数量为0,因此没有任何数据可以存储到7004上

    4.3.4.转移插槽

    我们要将num存储到7004节点,因此需要先看看num的插槽是多少:

    image-20210725161241793

    如上图所示,num的插槽为2765.

    我们可以将0~3000的插槽从7001转移到7004,命令格式如下:

    image-20210725161401925

    reshard译为重新切分。 

    具体命令如下:

    重新切分7001插槽

    image-20210725161506241

    得到下面的反馈:

    image-20210725161540841

    询问要移动多少个插槽,我们计划是3000个:

    新的问题来了:

    image-20210725161637152

    哪个node来接收这些插槽?

    显然是7004,那么7004节点的id是多少呢?

    image-20210725161731738

    复制这个id,然后拷贝到刚才的控制台后:

    image-20210725161817642

    这里询问,你的插槽是从哪里移动过来的?

    • all:代表全部,也就是三个节点各转移一部分
    • 具体的id:目标节点的id
    • done:没有了

    这里我们要从7001获取,因此填写7001的id:

    image-20210725162030478

    填完后,点击done,这样插槽转移就准备好了:

    image-20210725162101228

    确认要转移吗?输入yes:

    然后,通过命令查看结果:

    image-20210725162145497

    可以看到:

    image-20210725162224058

    目的达成。

    4.4.故障转移

    集群初识状态是这样的:

    image-20210727161152065

    其中7001、7002、7003都是master,我们计划让7002宕机。

    4.4.1.自动故障转移

    当集群中有一个master宕机会发生什么呢?

    直接停止一个redis实例,例如7002:

    redis-cli -p 7002 shutdown
    

    1)首先是该实例与其它实例失去连接

    2)然后是疑似宕机:

    image-20210725162319490

    3)最后是确定下线,自动提升一个slave为新的master:

    image-20210725162408979

    4)当7002再次启动,就会变为一个slave节点了:

    image-20210727160803386

    4.4.2.手动故障转移、指定master实例

    利用cluster failover命令可以手动让集群中的某个master宕机,切换到执行cluster failover命令的这个slave节点,实现无感知的数据迁移。其流程如下:

    image-20210725162441407

    这种failover命令可以指定三种模式:

    • 缺省:默认的流程,如图1~6歩
    • force:省略了对offset的一致性校验
    • takeover:直接执行第5歩,忽略数据一致性、忽略master状态和其它master的意见

    案例需求:在7002这个slave节点执行手动故障转移,重新夺回master地位

    步骤如下:

    1)利用redis-cli连接7002这个节点

    2)执行cluster failover命令

    如图:

    image-20210727160037766

    效果:

    image-20210727161152065

    4.5.RedisTemplate访问分片集群

    RedisTemplate底层同样基于lettuce实现了分片集群的支持,而使用的步骤与哨兵模式基本一致:

    1)引入redis的starter依赖

    1. <dependency>
    2. <groupId>org.springframework.bootgroupId>
    3. <artifactId>spring-boot-starter-data-redisartifactId>
    4. dependency>

    2)配置分片集群地址

    与哨兵模式相比,其中只有分片集群的配置方式略有差异,配置分片集群地址如下:

    1. spring:
    2. redis:
    3. cluster:
    4. nodes:
    5. - 192.168.150.101:7001
    6. - 192.168.150.101:7002
    7. - 192.168.150.101:7003
    8. - 192.168.150.101:8001
    9. - 192.168.150.101:8002
    10. - 192.168.150.101:8003

     哨兵模式的配置:

    1. spring:
    2. redis:
    3. sentinel:
    4. master: mymaster #与sentinel里的sentinel.conf配置文件的主库名一致
    5. nodes:
    6. - 192.168.150.101:27001
    7. - 192.168.150.101:27002
    8. - 192.168.150.101:27003

    3)配置读写分离

    1. @Bean
    2. public LettuceClientConfigurationBuilderCustomizer clientConfigurationBuilderCustomizer(){
    3. return clientConfigurationBuilder -> clientConfigurationBuilder.readFrom(ReadFrom.REPLICA_PREFERRED);
    4. }

  • 相关阅读:
    【Java分享客栈】一个包装过简历的新同事写完微信支付引起事故后果断离职了
    Python深度学习13——Keras模型的可视化(神经网络结构图)
    蓝牙信标的优势及应用场景
    第十届全球云计算大会 | 华云数据荣获“2013-2022十周年特别贡献奖”
    ffmpeg把视频文件转码为MP4格式
    mybatis-plus 连接oracle数据库查询无任何报错 Row: 0
    一阶系统阶跃响应实现规划方波目标值
    HashMap底层数据是如何存储的呢?
    双向门控循环单元BIGRU时序预测的matlab实现【源代码】
    新手怎样快速上手接口测试?掌握这几个知识点直接起飞!
  • 原文地址:https://blog.csdn.net/qq_40991313/article/details/126912298