• Redis的安全网:掌握RDB和AOF的持久化技术【redis第四部分】


    前言

    “在大数据时代,数据安全和持久性变得愈加重要。Redis,作为一款高性能的内存数据库,也不例外。但你是否知道Redis采用了两种不同的数据持久化机制,即RDB和AOF?本文将引领你进入Redis的数据安全之旅,我们将探索Redis数据持久化的精髓,理解RDB和AOF的区别,以及它们如何保护你的数据不受损失。准备好了吗?让我们开始吧!”

    第一:RDB和AOF是什么

    RDB(Redis Database Backup)和AOF(Append-Only File)是两种不同的持久化方式,用于在Redis中将数据保存到硬盘以便在Redis重启时进行恢复。它们具有各自的优点和适用场景。

    RDB(Redis Database Backup):

    1. 基本概念:RDB是Redis的一种快照持久化方式,它定期将整个数据集保存到磁盘。这个快照是一个二进制文件,它包含了某一时刻的所有数据。
    2. 触发条件:RDB可以配置在一定时间间隔或达到一定写操作次数时触发生成。
    3. 优点
      • 性能较好:生成RDB快照时,Redis会fork一个子进程,快照生成过程不会阻塞主进程,因此不会对性能产生太大影响。
      • 占用空间较小:RDB文件通常比AOF文件小,因为它只保存快照数据,不记录每个写操作。
    4. 适用场景:RDB适用于数据恢复速度要求快、对最近的数据一致性要求不高的场景,例如缓存数据。

    AOF(Append-Only File):

    1. 基本概念:AOF是一种持久化方式,它记录每个写操作作为追加(append)到文件的命令。当Redis重启时,通过重新执行这些命令,可以恢复整个数据集。
    2. 触发条件:AOF可以配置成每次写操作都同步到磁盘(fsync),或者定期执行fsync操作。
    3. 优点
      • 数据一致性更高:AOF记录每个写操作,因此在故障恢复时数据更加一致。
      • 不易发生数据丢失:由于AOF记录了每个写操作,即使Redis在生成AOF文件之前崩溃,也可以通过回放AOF文件来最小程度地恢复数据。
    4. 适用场景:AOF适用于对数据一致性要求高、可以承受一定性能损失的场景,如关键业务数据。

    异同点:

    • 性能:RDB通常性能更好,因为它生成快照时不需要记录每个写操作,而AOF需要记录每个写操作,可能会有一定性能开销。
    • 数据恢复速度:RDB恢复速度较快,因为只需要加载快照文件,而AOF需要重新执行所有写操作,可能会更慢。
    • 数据一致性:AOF提供更高的数据一致性,因为它记录每个写操作,而RDB只保存某一时刻的数据快照。

    在实际应用中,你可以根据你的需求来选择使用RDB、AOF或两者结合的持久化方式。通常,RDB可以用于创建备份,而AOF用于保证数据的一致性。

    第二:RDB机制的深入解析

    RDB(Redis Database Backup)是Redis的一种持久化机制,用于定期将整个数据集保存到硬盘,以便在Redis服务器重启时进行数据恢复。下面是RDB机制的深入解析,包括工作原理、配置触发、优点和局限性:

    工作原理:

    RDB的工作原理相对简单,它通过生成一个二进制快照文件,包含了某一时刻的所有数据。以下是RDB的工作流程:

    1. 触发快照:RDB的生成可以由多种触发条件来决定,通常包括:

      • 配置的时间间隔(如每小时生成一次)。
      • 配置的写操作次数阈值(如每10000次写操作生成一次)。
      • 手动触发,可以通过Redis命令来强制生成RDB快照。
    2. 生成快照:当RDB触发条件满足时,Redis会创建一个子进程来负责生成RDB快照。生成快照的过程中,Redis主进程继续处理请求,不会被阻塞。

    3. 写入硬盘:生成RDB快照后,Redis会将该快照写入硬盘上的一个新文件。这个过程通常使用写时复制(Copy-on-Write)机制,以确保数据的一致性。

    4. 替换旧RDB文件:生成新的RDB快照后,Redis会将旧的RDB文件替换为新的,以保持最新的数据。

    配置和触发:

    你可以通过Redis配置文件中的一些参数来配置RDB的触发条件,如以下示例:

    save 900 1      # 如果在900秒内有1次写操作,触发生成RDB
    save 300 10     # 如果在300秒内有10次写操作,触发生成RDB
    save 60 10000   # 如果在60秒内有10000次写操作,触发生成RDB
    
    • 1
    • 2
    • 3

    你还可以使用Redis命令手动触发RDB生成:

    SAVE      # 手动触发生成RDB
    
    • 1
    • save:在主线程中执行,会导致阻塞
    • bgsave:创建一个子进程,专门用于写入RDB文件,避免了主线程的阻塞,这也是Redis RDB文件生成的默认配置

    简单来说,bgsave 子进程是由主线程 fork 生成的,可以共享主线程的所有内存数据。bgsave 子进程运行后,开始读取主线程的内存数据,并把它们写入 RDB 文件。

    此时,如果主线程对这些数据也都是读操作(例如图中的键值对 A),那么,主线程和bgsave 子进程相互不影响。但是,如果主线程要修改一块数据(例如图中的键值对 C),那么,这块数据就会被复制一份,生成该数据的副本。然后,bgsave 子进程会把这个副本数据写入 RDB 文件,而在这个过程中,主线程仍然可以直接修改原来的数据。

    image-20220709153608415

    优点:

    1. 性能不受影响:RDB生成过程中,Redis主进程不会被阻塞,不会影响读写操作的性能。
    2. 紧凑的数据格式:RDB文件是一个二进制文件,通常比AOF文件更紧凑,占用较小的磁盘空间。
    3. 快速数据恢复:在恢复数据时,RDB快照可以更快地加载,因为它只需要加载一个文件。

    局限性:

    1. 数据可能有损失:RDB生成过程中,如果Redis服务器崩溃,可能会导致最后一次生成RDB之后的数据丢失。
    2. 不适用于实时备份:RDB适用于创建备份,但不适用于实时备份,因为触发条件是基于时间或写操作的。
    3. 文件比较大:虽然比AOF紧凑,但RDB文件仍然可能很大,特别是在有大量数据的情况下。
    4. bgsave子进程需要通过fork操作从主线程创建出来。虽然,子进程在创建后不会再阻塞主线程,但是,fork 这个创建过程本身会阻塞主线程,而且主线程的内存越大,阻塞时间越长。如果频繁 fork 出 bgsave 子进程,这就会频繁阻塞主线程了。

    总之,RDB是Redis的一种快照持久化方式,适用于数据恢复速度要求快、对最近数据一致性要求不高的场景,例如用作缓存。配置RDB触发条件并定期生成快照可以为数据提供额外的保护层。但要注意,在生产环境中,通常建议结合AOF方式以提高数据的一致性和保护。

    第三:AOF机制的深入解析

    AOF(Append-Only File)是Redis的一种持久化机制,用于记录每个写操作作为命令追加到一个文件中,以便在Redis服务器重启时进行数据恢复。下面是AOF机制的深入解析,包括工作原理、配置和管理、优势和劣势:

    工作原理:

    AOF的工作原理相对直观,它将每个写操作以命令的形式追加到一个AOF文件中,文件内容为一系列Redis命令。以下是AOF的工作流程:

    1. 写操作记录:每次Redis执行一个写操作(例如SET、DEL、INCR等),对应的命令会被追加到AOF文件的末尾。

    2. 定期写入:AOF文件内容会被定期写入磁盘,以确保数据的持久性。这个操作可以根据配置的fsync策略来触发。

    3. 数据恢复:当Redis服务器重启时,AOF文件中的命令会按顺序被重新执行,从而恢复数据到与重启前一致的状态。

    对于日志,我们比较熟悉的是数据库的写前日志,也就是在实际写数据前,先把修改的数据记到日志文件中,以便故障时进行恢复。AOF日志正好相反,它是写后日志,也就是先执行命令,然后将数据写入内存,再记录日志,如下图:

    image-20220709141919263

    ❓:日志中记录了什么

    传统的数据库日志记录的是修改后的日志。而AOF里记录的是Redis收到的每一条命令,这些命令以文本方式保存的。

    ♐️:例如set testkey testvalue

    image-20220709142146020

    其中上面的*3表示当前命令有三个部分

    🏚:重点是为了避免额外的开销,在记录日志的时候不会检查命令的语法,所以如果先记日志再执行命令的话,可能日志中就有错误的命令。

    ☯️:除此之外,AOF还有一个好处,它在命令执行后才记录日志,所以不会阻塞当前的写操作

    配置和管理:

    你可以通过Redis配置文件中的一些参数来配置AOF的工作方式,如以下示例:

    appendonly yes          # 启用AOF持久化
    appendfsync always      # 每个写操作都同步到磁盘
    appendfilename "appendonly.aof"  # AOF文件的名称
    
    • 1
    • 2
    • 3

    常见的fsync策略包括:

    • always:每次写操作都会同步到磁盘,最安全但性能较低。
    • everysec:每秒同步一次,适中的性能和数据安全性。
    • no:不进行同步操作,性能最高但安全性最低。

    重写机制

    AOF(Append-Only File)的重写机制是一项用于优化AOF文件大小的功能,它有助于解决AOF文件可能变得过大的问题。AOF重写不仅减小AOF文件的体积,还提高了性能。以下是AOF的重写机制的详细解释:

    AOF重写机制的工作原理:

    AOF重写机制的主要目标是生成一个新的AOF文件,其中包含了与原始AOF文件相同的数据,但是文件大小更小,不包含不必要的数据。这个过程通过扫描内存中的数据并将其转化为AOF文件的命令集合来实现。

    具体步骤如下:

    1. Redis服务器启动一个后台进程,该进程负责执行AOF重写。
    2. 后台进程扫描Redis的内存数据,记录了在内存中发生的所有写操作,以及这些操作对应的命令。
    3. 这些命令被写入一个新的AOF文件,生成的文件仅包含了重写期间写入的数据。
    4. 当新AOF文件生成完成后,原始AOF文件被备份,然后新AOF文件替换原始文件。
    5. 重写完成后,Redis服务器仅使用新的AOF文件进行数据持久化。

    image-20220709153608415

    AOF重写的优点:

    1. 减小AOF文件的体积:AOF重写可以去除AOF文件中不再需要的数据,因此新的AOF文件通常比原始文件更小,占用更少的磁盘空间。
    2. 提高读写性能:新的AOF文件包含了重写期间的写操作,因此加载新AOF文件时速度更快,不需要重放整个历史数据。
    3. 降低AOF文件的维护成本:原始AOF文件可能变得非常大,而重写机制有助于保持AOF文件的适度大小,减少维护成本。

    AOF重写的限制:

    1. AOF重写是一个后台进程,因此在执行期间可能占用CPU和I/O资源,可能对服务器性能产生一些影响。但这通常是可以控制的,并且可以通过合理配置来限制其执行时机。
    2. AOF重写仅处理发生在重写过程中的写操作,因此对于AOF文件的压缩和性能提升有一定限制。如果原始AOF文件非常大,重写可能需要较长时间执行。

    总之,AOF重写机制是一种非常有用的工具,可用于优化AOF文件大小、提高性能,并降低AOF文件的维护成本。在实际应用中,建议根据实际情况定期执行AOF重写,以确保AOF文件保持合理的大小。

    优势:

    1. 数据一致性:AOF记录每个写操作,因此在恢复数据时数据更加一致,不容易发生数据丢失。
    2. 故障恢复:即使Redis在生成AOF文件之前崩溃,也可以通过回放AOF文件来最小程度地恢复数据。
    3. 适用于重要数据:AOF适用于对数据一致性要求高的场景,如关键业务数据。
    4. 可读性:AOF文件是文本文件,可以查看和检查其中的命令,方便调试和分析。

    劣势:

    1. 性能开销:AOF记录每个写操作,可能会有一定性能开销,特别是当fsync策略配置为always时。
    2. 文件较大:AOF文件通常比RDB文件大,因为它包含了每个写操作的命令,可能占用较多磁盘空间。
    3. 数据恢复速度慢:AOF在数据恢复时,需要重新执行所有命令,可能比加载RDB快照慢。

    在实际应用中,你可以根据需求和数据的重要性来选择使用AOF、RDB或两者结合的持久化方式。通常,AOF用于保证数据的一致性,而RDB用于创建备份。同时,可以通过合理的配置来平衡数据恢复速度和性能开销。

    第四:AOF+RDB实现增量快照

    在实际应用中,如果AOF日志文件不断积累,可能会占用大量磁盘空间。可以考虑只保留两个RDB快照之间的AOF日志,然后删除较旧的AOF日志,以降低磁盘使用。

    下面是一种基于这个思路的增量快照实现方法:

    1. 启用AOF持久化:在Redis配置中启用AOF持久化。
    appendonly yes
    
    • 1
    1. 配置AOF重写:启用AOF重写机制以控制AOF文件大小,同时配置RDB以定期生成快照文件。
    auto-aof-rewrite-percentage 100
    auto-aof-rewrite-min-size 64mb
    
    • 1
    • 2
    1. 设置AOF文件保留策略:使用外部脚本或定期任务来监视AOF文件,并根据需要进行删除。

    你可以编写一个脚本,该脚本定期检查AOF文件的生成时间,然后删除旧于两个RDB快照之间的AOF文件。这可以通过Redis的BGREWRITEAOF命令来触发,以确保AOF文件在RDB生成时进行清理。你可以使用如下的步骤:

    • 定期执行BGREWRITEAOF命令以生成新的AOF文件。
    • 当新的RDB快照生成后,检查AOF文件的生成时间,将旧于两个RDB快照之间的AOF文件删除。

    这种方法可以确保AOF文件保留在一个合理的大小范围内,同时提供增量快照的功能。当数据需要恢复时,首先加载RDB文件,然后执行最新的AOF文件中的写操作以保持数据的一致性。这样,你既能够获得数据保护,又能够有效控制AOF文件的大小。

    第五:高可用性和灾难恢复

    Redis Sentinel和Redis Cluster是用于实现高可用性和灾难恢复的Redis架构组件。它们可以与RDB和AOF持久化机制结合使用以提供数据安全性。下面深入介绍它们如何一起使用:

    Redis Sentinel

    1. 高可用性:Redis Sentinel用于监控Redis主从架构中的服务器,以确保主服务器的可用性。当主服务器出现故障时,Sentinel可以自动选择一个从服务器升级为新的主服务器,从而保持服务的高可用性。
    2. 持久化:Sentinel本身不负责数据持久化,但您可以配置Redis实例以使用RDB和AOF来进行数据持久化。这有助于在主服务器故障时,新的主服务器可以使用RDB文件或AOF文件进行数据恢复。
    3. 实际用例:在一个具有高可用性要求的应用中,可以配置Redis Sentinel来监控多个Redis实例。每个实例都可以配置RDB和AOF持久化。当主服务器发生故障时,Sentinel会自动升级一个从服务器,从而保持服务的可用性,同时利用RDB和AOF来确保数据的完整性。

    Redis Cluster

    1. 高可用性:Redis Cluster是用于分片和分布式Redis环境的工具,它将数据分布到多个Redis节点。每个节点都可以配置RDB和AOF以实现数据持久化。当一个节点发生故障时,集群会自动迁移槽位,从而保持服务的高可用性。
    2. 持久化:每个Redis Cluster节点都可以独立配置RDB和AOF持久化,以确保数据安全。这意味着即使一个节点发生故障,其他节点上的数据仍然可用。
    3. 实际用例:Redis Cluster适用于需要水平扩展和高可用性的应用。您可以配置多个Redis节点以创建一个分布式集群,每个节点都可以配置RDB和AOF。这有助于确保数据安全性和高可用性。

    结合使用RDB和AOF

    • 在高可用性和灾难恢复方案中,通常建议同时使用RDB和AOF。RDB用于创建定期快照备份,AOF用于记录实时写操作。
    • 对于Redis Sentinel和Redis Cluster,使用RDB和AOF可以提供额外的保障,确保数据不会丢失,并且可以在主服务器故障后迅速还原数据。
    • 对于Redis Cluster,每个节点的独立持久化配置可以在节点级别实现数据恢复。

    总之,Redis Sentinel和Redis Cluster与RDB和AOF持久化机制结合使用可以实现高可用性和灾难恢复的Redis环境。这提供了多层次的数据安全和可恢复性,以满足不同应用的需求。在配置时,确保持久化设置与高可用性配置相协调,以实现最佳的数据保护和可用性。

  • 相关阅读:
    CANoe的数据回放(Replay Block),还是要结合CAPL脚本才能说的明白
    Android Studio 引入Xui框架-简单应用
    伴随第四次电气革命实现半导体行业的可持续智能增长
    Java实习生常规技术面试题每日十题Java基础(五)
    数据分析学习记录(二)---响应曲面法及Design-Expert的简单使用
    SpringBoot面试专题及答案
    如何在外地外网电脑远程公司项目?
    go语言|数据结构:二叉树可视化(制作svg格式树形图)
    算法竞赛进阶指南0x35高斯消元与线性空间
    python 读写csv文件
  • 原文地址:https://blog.csdn.net/Mrxiao_bo/article/details/134004188