• kafka 高水位


    kafka中HW(High Watermark)有两个作用

    一是用来表示哪些消息可以被消费者消费,相当于分界线
    
    二是帮助kafka完成副本的同步
    
    • 1
    • 2
    • 3

    位移值小于高水位的是已提交消息,可被消费者消费,大于等于高水位的消息,属于

    未提交消息,不可被消费者消费

    Log End Offset 日志末端位移,LEO是表示副本写入下一条消息的位移,介于高水位

    和LEO之间的消息就是未提交消息,所以同一个副本中,高水位是不会超过LEO的

    Kafka 使用 Leader 副本的高水位来定义所在分区的高水位。换句话说,分区的高水位就是其

    Leader 副本的高水位

    HW更新机制

    在这里插入图片描述
    Broker 0 上保存了某分区的 Leader 副本和所有 Follower 副本的 LEO 值, Broker 1 上仅仅保

    存了该分区的某个 Follower 副本。Kafka 把 Broker 0 上保存的这些 Follower 副本又称为

    远程副本(Remote Replica)。Kafka 副本机制在运行过程中,会更新 Broker 1 上 Follower

    副本的高水位和 LEO 值,同时也会更新 Broker 0 上 Leader 副本的高水位和 LEO 以及

    所有远程副本的 LEO,但它不会更新远程副本的高水位值

    当生产者发送一条消息时,对应分区的leader副本将消息落盘后,LEO更新为1,这时follower

    来同步消息,于是把自己的LEO也更新成了1,下一轮同步中,follower来拉去位移是1的消息,

    leader接收消息后,把远程副本的LEO更新为1,然后更新HW为1,在更新LEO或者更新

    远程副本的LEO之后,leader会取这两个的最小值更新为HW,然后把自己的HW值发给follower,follower接到消息后把自己的HW更新为1.通过这种机制实现了Leader和Follower副本之间的同步

  • 相关阅读:
    Cesium源码解析二(metadataAvailability的含义)
    Mongodb支持事务吗?
    SQL*PLUS对文本长度的限制
    第一节——vue安装+前端工程化
    SpringCloud-Nacos集群搭建
    kettle从入门到精通 第五十三课 ETL之kettle MQTT/RabbitMQ consumer实战
    基于docker-k8s的web集群
    kubernetes集群编排(8)
    TIOBE 5 月榜单揭晓:哪些编程语言正在上升?
    Python和Scrapy构建可扩展的框架
  • 原文地址:https://blog.csdn.net/qq_30505673/article/details/125434309