一致性 Hash 算法

是什么：

一致性 hash，是一种比较特殊的 hash 算法，它的核心思想是解决在分布式环境下， hash 表中可能存在的动态扩容和缩容的问题。

一般情况下，我们会使用 hash 表的方式以 key-value 的方式来存储数据，但是当数据量比较大的时候，我们就会把数据存储到多个节点上，（如图）然后通过 hash 取模的方法来决定当前 key 存储到哪个节点上。

这种方式有一个非常明显的问题，就是当存储节点增加或者减少的时候，原本的映射关系就会发生变化。也就是需要对所有数据按照新的节点数量重新映射一遍，这个涉及到大量的数据迁移和重新映射，迁移代价很大。

而一致性 hash 就是用来优化这种动态变化场景的算法，它的具体工作原理也很简单。首先，一致性 Hash 是通过一个 Hash 环的数据结构来实现的，（如图），这个环的起点是 0，终点是 2^32-1。也就是这个环的数据分布范围是[0,2^32-1]。

（如图）然后我们把存储节点的 ip 地址作为 key 进行 hash 之后，会在 Hash 环上确定一个位置。

接下来，（如图）就是把需要存储的目标 key 使用 hash 算法计算后得到一个 hash 值，同样也会落到 hash 环的某个位置上。然后这个目标 key 会按照顺时针的方向找到离自己最近的一个节点进行数据存储。

假设现在需要新增一个节点（如图）node4，那数据的映射关系的影响范围只限于node3 和 node1，只有少部分的数据需要重新映射迁移就行了。

如果是已经存在的节点 node1 因为故障下线了（如图），只那只需要把原本分配在 node1 上的数据重新分配到 node2 上就行了。同样对数据影响的范围非常小。

所以，一致性 hash 算法的好处是扩展性很强，在增加或者减少服务器的时候，数据迁移范围比较小。另外，在一致性 Hash 算范里面，为了避免 hash 倾斜导致数据分配不均匀的情况，我们可以使用虚拟节点的方式来解决。

相关阅读:
TVM神经编译器
从计算机视觉算法实训走向落地尝试
数据结构-堆排序及其复杂度计算
二层业务与隔离（VLAN与Trunk）
Win11怎么安装语音包？Win11语音包安装教程
【夜读】影响一生的五大定律内心强大的人，有这五种特质
zkLogin构建者的最佳实践和业务思考
用 19 个基本脉动调查问题追踪趋势
DETR实现目标检测(一)-训练自己的数据集
AI之浅谈

原文地址：https://blog.csdn.net/qq_43276879/article/details/133386982