kafka中HW(High Watermark)有两个作用
一是用来表示哪些消息可以被消费者消费,相当于分界线
二是帮助kafka完成副本的同步
位移值小于高水位的是已提交消息,可被消费者消费,大于等于高水位的消息,属于
未提交消息,不可被消费者消费
Log End Offset 日志末端位移,LEO是表示副本写入下一条消息的位移,介于高水位
和LEO之间的消息就是未提交消息,所以同一个副本中,高水位是不会超过LEO的
Kafka 使用 Leader 副本的高水位来定义所在分区的高水位。换句话说,分区的高水位就是其
Leader 副本的高水位
Broker 0 上保存了某分区的 Leader 副本和所有 Follower 副本的 LEO 值, Broker 1 上仅仅保
存了该分区的某个 Follower 副本。Kafka 把 Broker 0 上保存的这些 Follower 副本又称为
远程副本(Remote Replica)。Kafka 副本机制在运行过程中,会更新 Broker 1 上 Follower
副本的高水位和 LEO 值,同时也会更新 Broker 0 上 Leader 副本的高水位和 LEO 以及
所有远程副本的 LEO,但它不会更新远程副本的高水位值
当生产者发送一条消息时,对应分区的leader副本将消息落盘后,LEO更新为1,这时follower
来同步消息,于是把自己的LEO也更新成了1,下一轮同步中,follower来拉去位移是1的消息,
leader接收消息后,把远程副本的LEO更新为1,然后更新HW为1,在更新LEO或者更新
远程副本的LEO之后,leader会取这两个的最小值更新为HW,然后把自己的HW值发给follower,follower接到消息后把自己的HW更新为1.通过这种机制实现了Leader和Follower副本之间的同步