• Kafka的 ISR 概念和作用


    一、ISR 是什么

    首先,ISR 的全称叫做: In-Sync Replicas (同步副本集), 我们可以理解为和 leader 保持同步的所有副本的集合。
    一个分区的所有副本集合叫做 AR( Assigned Repllicas )
    与 leader-replica 未能保持同步的副本集叫做 OSR( Out-Sync Relipcas )
    因此我们就能得到这么一个表示:AR = ISR + OSR,翻译一下就是一个分区的副本集分为同步集合和非同步集合两部分。
    那么我们可以假设一个场景,一个分区的 AR 集合为【0,1,2,3,4,5】,其中 leader-replica 是 0
    其中【1,2,3】作为 follower 和 leader 的数据保持同步,而【4,5】未能和 leader 保持同步,
    那么此时,ISR=【0,1,2,3】,OSR=【4,5】
    如果此时副本 4 追上了 leader-replica,也就是和 leader 保持到了同步
    那么此时,ISR=【0,1,2,3,4】,OSR=【5】
    从上面的场景我们就可以明白,ISR 动态维护了一个和 leader 副本保持同步副本集合,ISR 中的副本全部都和 leader 的数据保持同步。

    二、ISR 的作用是什么

    我们思考一下,我们知道了与 leader 保持同步的副本集后,可以做到哪些事情?
    1、当我们生产消息的时候,到底要写入多少副本才能算成功呢?
    2、当 leader 挂了之后,我们应该选择哪个 follower 来成为新的 leader 呢?
    那么对应的,通过 ISR,我们知晓了哪些 follower 与 leader 保持着同步,
    那么我们就可以在写入消息的时候,设置写入处于 ISR 中所有的副本才算成功,
    那么我们在进行 leader 切换的时候,就可以从 ISR 中选择对应的 follower 成为新的 leader。
    这就是 ISR 的作用:是通过副本机制实现消息高可靠,服务高可用时,不可缺少的一环;这也是为什么讲到副本不得不提到 ISR 的原因。

    三、为什么要设计 ISR 机制

    在一些中间件中,都有副本的概念,在不同的场景下写入数据时,要求写入副本的个数也不尽相同。
    例如 zk 中要求写入的节点个数大于一半才算成功,或者有些要求高可靠性的场景,规定写入所有副本才能算成功。
    kafka 的 ISR 可以允许生产消息时,根据自己的业务场景自行配置想要达到的效果:
    acks=0:fire and forget,也就是我发了就算完了,后续成不成功我都不管,这种设置下消息的高可靠性几乎没有保障,但是有极大的吞吐量。
    acks=1:写入主节点就算成功,这种设置,可以保障一定的高可靠性,也具有不错的吞吐量。
    acks=all:也就是写入 ISR 中所有的副本才算成功,这种设置下,就能提供较高的高可靠性,但是吞吐量就相对较低。
    我们在考虑生产消息时,ISR 机制可以友好的让使用者根据自己的业务需求去设置参数,去选择自己想要达到什么程度的可靠性,而不是只提供一种可靠性选择。

    补充:我们的 ISR 是动态伸缩的,可能出现 follower 全部都挂了,ISR 中只剩下 leader,那么此时设置 acks=all 就等价于 acks=1 了
    这样就会对高可靠性要求的场景产生危险,那么 kafka 提供了参数:min.insync.replicas
    这个参数可以配置最少 ISR 中需要多少个副本,才能继续提供写服务。如果设置为 2,一旦 ISR 中的个数小于 2,那么就不再提供写服务,牺牲一定的可用性,来保障这种高可靠的场景需求。

    最后,我们回答这个小节的问题:ISR 机制的存在是 kafka 为了平衡可靠性和可用性,不指定提供高可靠或者高可用的服务,而是将决定权交给了使用者,让使用者通过参数来控制,到底要实现什么程度的高可靠与高可用。

  • 相关阅读:
    软件测试(一)
    ⽬标⾏动及稠密环境未知情况下,⽆⼈机跟踪的系统解决⽅案
    使用python-docx完成word操作
    解读GaussDB(for MySQL)灵活多维的二级分区表策略
    基于Java+SpringBoot+vue前后端分离校园周边美食探索分享平台设计实现
    Windows 图像处理组件(WIC)读写位深度24位的 bmp 文件
    [附源码]计算机毕业设计springboot第三方游戏零售平台
    JAVA智慧防疫上报系统服务端计算机毕业设计Mybatis+系统+数据库+调试部署
    Leetcode47 全排列II
    大数据产业酝酿巨变 元宇宙新格局呼之欲出
  • 原文地址:https://blog.csdn.net/qq_24434251/article/details/126956271