• Redis持久化机制


    Redis为什么数据要持久化?

    Redis是内存数据库,如果数据不进行持久化,一旦Redis服务器重启数据会全部丢失。

    注意:如果Redis只做缓存,你也可以不使用任何持久化方式。

    什么是Redis数据持久化

    把数据存储到硬盘中,当服务器开启的时候再读入到内存中去,这就是redis数据的持久化。

    Redis提供三种持久化机制:RDB、AOF和Redis 4.0之后推出的混合持久化机制

    注意:修改的redis的配置文件,要重启redis才能生效。

    RDB(默认机制)

    RDB全称Redis Database Backup file(Redis数据备份文件),也叫Redis数据快照【对性能影响低,推荐使用】

    每次触发RDB,就会把整个Redis当前时刻的快照数据记录到dump.rdb文件(二进制文件,内容看不懂)中。

    关闭rdb机制只需要将配置文件所有的save保存策略注释掉,再加将save设置为空。

    1. # save 3600 1
    2. # save 300 100
    3. # save 60 10000
    4. save ""

    rdb机制触发的时机

    • 配置文件中save的规则满足的情况下,会自动触发rdb机制

    • 执行flushall命令,会触发我们的rdb机制,但里面是空的,无意义

    • 关闭redis服务器,会触发我们的rdb机制(突然宕机不会触发)

    • save/bgsave指令会执行

      • save使用主进程持久化,这个过程中其它所有命令都会被阻塞 ,效率低(同步),不使用

      • gbsave创建子进程进行持久化(异步),主进程可以持续处理用户请求

    配置文件RDB触发机制

    在一段时间内,检测key的变化情况,据然后持久化某一个时刻的快照数据(底层使用bgsave)

    1. # 900秒内至少修改key 1次,会触发rdb机制
    2. save 900 1
    3. # 300秒内至少修改key 10次,会触发rdb机制
    4. save 300 10
    5. # 60秒内至少修改key 1000次,会触发rdb机制
    6. save 60 10000

    持久化执行过程

            Redis会fork一个子进程进行持久化,子进程共享主进程的内存数据,子进程采用的是copy-on-write技术将数据写到临时文件(dump.rdb)中,待持久化过程结束,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能。

    copy-on-write技术

    • 主进程执行读操作时,访问共享内存

    • 当主进程执行写操作时,则会拷贝一份数据,执行写操作

    数据恢复

    只需要把dump.rdb放在redis的配置文件指定的目录下即可,redis启动时,会自动检查dump.rdb文件,恢复数据。

    生产环境我们会对dump.rdb文件进行备份。

    其他配置

    1. # 写入文件中是否压缩 ,建议不开启,压缩也会消耗cpu,磁盘的话不值钱(默认是开启的)
    2. rdbcompression yes
    3. # RDB文件名称
    4. dbfilename dump.rdb
    5. # 文件保存的路径目录
    6. dir ./

    优点

    • 适合大规模的数据恢复。
    • 对数据的完整性要求不高。
    • 持久化的整个过程中,主进程不进行任何IO操作,确保了极高的性能。

    缺点

    • fork子进程会占用一定的内存空间。
    • redis意外宕机,还没触发save,最后一次修改的数据就没了。

    AOF

    AOF全称为Append Only File(追加文件)

    以日志的方式把所有写的操作都记录到文件中(无限追加写入)

    恢复数据时,把这个文件中所有的写操作再执行一遍。

    开启aof(默认不开启)

    1. # appendonly no
    2. appendonly yes

    持久化策略

    1. # 每执行一次写命令,立即记录到AOF文件,几乎不丢失数据,性能影响严重
    2. # appendfsync always
    3. # 写命令执行完先放入AOF缓冲区,然后表示每隔1秒将缓冲区数据写到AOF文件,最多会丢失这1s的数据
    4. appendfsync everysec # (默认)【推荐】
    5. # 写命令执行完先放入AOF缓冲区,由操作系统决定何时将缓冲区内容写回磁盘,性能最好,可能丢失大量数据
    6. # appendfsync no
    • 每一次修改都同步,文件的完整性更好,性能极差

    • 每一秒同步一次,可能会丢失一秒的数据

    • 从不同步,效率最高,安全性最差

    aof文件名称

    1. # The name of the append only file (default: "appendonly.aof")
    2. appendfilename "appendonly.aof"

    aof文件分析

    如执行命令set zhuge 666,aof文件里会记录如下数据:

    1. 1 *3 # 代表指令的length = 3
    2. 2 $3 # 代表关键字参数的长度 lenth(set) = 3
    3. 3 set
    4. 4 $5 # key字符串长度
    5. 5 zhuge
    6. 6 $3 # value字符串长度
    7. 7 666

    redis-check-aof工具

    如果aof文件有错误,redis是启动不起来的,我需要修改这个aof文件

    redis给我们提供了一个工具redis-check-aof,执行指令来修复aof文件

    redis-check-aof --fix appendonly.aof

    AOF重写

    AOF文件里可能有很多没用指令,所以AOF会定期根据内存的最新数据生成aof文件。

    例如,执行了如下几条命令:

    1. 127.0.0.1:6379> incr readcount
    2. (integer) 1
    3. 127.0.0.1:6379> incr readcount
    4. (integer) 2
    5. 127.0.0.1:6379> incr readcount
    6. (integer) 3
    7. 127.0.0.1:6379> incr readcount
    8. (integer) 4
    9. 127.0.0.1:6379> incr readcount
    10. (integer) 5

    aof文件中就会有1 - 5的所有记录,但重写后AOF文件里变成只有5

    1. 1 *3
    2. 2 $3
    3. 3 SET
    4. 4 $2
    5. 5 readcount
    6. 6 $1
    7. 7 5

    再例如

    如下两个配置可以控制AOF自动重写频率

    1. auto‐aof‐rewrite‐percentage 100 # aof文件自上一次重写后文件大小增长了100% 则再次触发重写
    2. auto‐aof‐rewrite‐min‐size 64mb # aof文件至少要达到64M才会自动重写,文件太小恢复速度本来就很快,重写的意义不大
    3. # 第一次触发重写文件要达到64M,第二次128M,以此类推

    当然AOF还可以手动重写,进入redis客户端执行命令bgrewriteaof重写AOF。

    注意,AOF重写redis会fork出一个子进程去做(与bgsave命令类似),不会对redis正常命令处理有太多影响。

    RDB和AOF的对比

    aof文件大小远远大于rdb,修复速度也比rdb慢,aof运行效率比rdb慢

    对于大规模恢复数据,且对数据恢复的完整性不是非常敏感,那RDB要比AOF更加高效。

    指令RDBAOF
    启动优先级
    文件大小
    恢复速度
    数据安全性容易丢数据根据策略决定
    数据恢复优先级低,因为数据完整性不如aof

    高,因为数据完整性更高rdb

    生产环境可以都启用,rdb和aof文件都会生成,redis启动时如果既有rdb文件又有aof文件则优先选择aof文件恢复数据,因为aof一般来说数据更全一点。

    混合持久化【推荐】       

    Redis 4.0 提供混合持久化方式,权衡rdb 和 aof,使用这种方式建议关闭rdb(注释配置文件的所有save)

            重启Redis时,我们很少使用RDB来恢复内存状态,因为会丢失大量数据。我们通常使用AOF 日志重放,但是重放 AOF 日志性能相对 RDB来说要慢很多,这样在Redis数据很大的情况下,启动需要花费很长的时间。 Redis 4.0 为了解决这个问题,提供一个新的持久化机制 - 混合持久化。

    通过如下配置可以开启混合持久化。

     aof‐use‐rdb‐preamble yes  # 默认这种方式是关闭的,必须先开启aof

            如果开启了混合持久化,AOF在重写时,将重写这一刻之前的内存做RDB快照处理,并且将RDB快照内容(二进制)写入到新的aof文件,写入过程中,如果有新的命令,则会以aof的方式追加到新的aof文件某末尾。新的文件一开始不叫appendonly.aof,等到重写完新的AOF文件才会进行改名,覆盖原有的AOF文件,完成新旧两个AOF文件的替换。

    总结:就是把原来aof重写机制修改,其他不变,触发重写机制时把rdb快照数据存到aof文件中,当有新的数据加入,以aof的方式追加到文件末尾(aof格式),每秒记录一次(看aof的配置)编辑。

    线上Redis持久化策略一般如何设置

    如果对性能要求较高,在Master最好不要做持久化,可以在某个Slave开启AOF备份数据,

    策略设置为每秒同步一次即可。(我们一般作为缓存使用,丢一秒数据无所谓)

  • 相关阅读:
    Spring IOC源码:obtainFreshBeanFactory 详解(上)
    Chrome为什么不用COOKIE
    软件开发定律:霍夫施塔特定律,为什么项目交付总是会延期?
    为什么我们在写java 代码的时候一定要public static关键字的作用?
    红细胞装载阿霉素/羟基喜树碱/丹参酮IIA磺酸钠/地塞米松磷酸钠/维生素K1制备方法
    MongoDB数据接入实践
    【c++】stringstream基础:实现数据类型转换和字符串分割
    安防视频/集中云存储平台EasyCVR(V3.3)部分通道显示离线该如何解决?
    mediasoup学习与实践
    简单剖析Hashmap
  • 原文地址:https://blog.csdn.net/m0_56750901/article/details/126646529