一、概念
二、哈希冲突
三、如何解决哈希冲突?
1.哈希函数
引起哈希冲突的一个原因可能是:哈希函数设计不够合理。 哈希函数设计原则: 哈希函数的定义域必须包括需要存储的全部元素,而如果散列表允许有m个地址时,其值域必须在0到m-1之间哈希函数计算出来的地址能均匀分布在整个空间中。
常见的哈希函数:直接定制法(Hash(Key)= A*Key + B)、除留余数法(Hash(key) = key% p)、平方取中法(假设关键字为1234,对它平方就是1522756,抽取中间的3位227作为哈希地址)、随机数法(即H(key) = random(key),random为随机函数)等等。哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是还是无法避免哈希冲突。
2.负载因子调节
哈希表中已有的元素个数是不可变的,那能调整的就只有哈希表中的数组的大小了。
3.闭散列
4.开散列(哈希桶)
开散列法又叫链地址法(开链法),首先对元素集合用散列函数计算散列地址,具有相同地址的元素归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中。开散列中每个桶中放的都是发生哈希冲突的元素。开散列,可以认为是把一个在大集合中的搜索问题转化为在小集合中做搜索了。那如果冲突严重,就意味着小集合的搜索性能其实也时不佳的,这个时候我们就可以将这个所谓的小集合搜索问题继续进行转化,例如:
四、模拟实现哈希桶
- public class HashBucket
{ - static class Node
{ - public K key;
- public V val;
- public Node
next; - public Node(K key,V val){
- this.key = key;
- this.val = val;
- }
- }
- public Node
[] array; - public int size;
- private static final double LOAD_FACTOR = 0.75;
- private static final int DEFAULT_SIZE = 8;
- public HashBucket(){
- this.array = new Node[DEFAULT_SIZE];
- }
- public Node
put(K key, V value) { - int hash = key.hashCode();
- int index = hash % array.length;
- Node
cur = array[index]; - while (cur != null){
- if (cur.val == value){
- cur.val = value;
- return cur;
- }
- cur = cur.next;
- }
- Node
node = new Node<>(key,value); - node.next = array[index];
- array[index] = node;
- size++;
- if (loadFactor() >= LOAD_FACTOR){
- resize();
- }
- return node;
- }
-
-
- private void resize() {
- Node
[] newArray = new Node[2*array.length]; - for (int i = 0; i < array.length; i++) {
- Node
cur = array[i]; - while (cur != null){
- Node
curNext = cur.next; - int hash = cur.key.hashCode();
- int newIndex = hash % newArray.length;
- cur.next = newArray[newIndex];
- newArray[newIndex] = cur;
- cur = curNext;
- }
- }
- array = newArray;
- }
-
- public Node
get(K key,V val){ - int hash = key.hashCode();
- int index = hash % array.length;
- Node
node = array[index]; - while (node != null){
- if (node.key == key){
- return node;
- }
- node = node.next;
- }
- return null;
- }
-
-
- private double loadFactor() {
- return size * 1.0 / array.length;
- }
-
- }
总结