其实就是四种方法的演变
1.开放定址法
具体就是把数据的标志等的对长度取模
有三种不同的取模
线性探测再散列 给数据的标志加增量,取模
平方探测再散列 给数据的标志平方,取模
随机探测再散列 把数据的标志随机化,取模
线性,平方显然很容被人猜出规律,所以最终是随机,那么是不是存在随机会出现取模的值相等的情况?
2.链地址法
而解决值不同,hash相同的方法有链地址法。
//先从数组上取下原来的值,给塞到新的节点去,然后把新的节点再放到数组上。 void createEntry(int hash, K key, V value, int bucketIndex) { Entry<K,V> e = table[bucketIndex]; table[bucketIndex] = new Entry<>(hash, key, value, e); size++; } Entry(int h, K k, V v, Entry<K,V> n) { value = v; next = n; key = k; hash = h; }
将值不同hash相同的放在同一个地方,取值时遍历数据。
那么是不是存在一个地方有几个值,一个地方没有值的情况?
3.再hash法
就是当hash遇到重复的hash的时候,给自己在hash一次,然后hashCount+1,说明要多hash一次获取地址。
那么是不是存在hashCount+9999999,才能找到地址的情况?
4.建立一个公共溢出区
上面都有hashCount来记录hash的次数了,我直接新一个公共溢出区,用overIndex=99来记录不是更好吗?
那么,hash冲突基本解决,但是同样存在一个问题!
建立一个公共溢出区在map容器小的时候,作用不大,放在公共溢出区还不如扩容。只有当map的容器越大,扩容需要的空间越多,公共溢出区才实用。
5.java的hash冲突解决 链地址法
put方法分析
public V put(K key, V value) { //hash()方法在上面已经出现过了,就不贴了 return putVal(hash(key), key, value, false, true); } final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K, V>[] tab; Node<K, V> p; int n, i; // tab为空则创建 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; // 计算index,并对null做处理 if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { Node<K, V> e; K k; // 节点key存在,直接覆盖value if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; // 判断该链为红黑树 else if (p instanceof TreeNode) e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value); // 该链为链表 else { for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); //链表长度大于8转换为红黑树进行处理 TREEIFY_THRESHOLD = 8 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } // key已经存在并相等,不往链表加值 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break;
// key不存在,p,e是老值,p.next是新值 p = e; } } if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e);
//链地址法触发,返回老值,写了这么久代码才知道put返回不仅仅是null。 return oldValue; } } ++modCount; // 超过最大容量 就扩容 threshold:单词解释--阈(yu)值,不念阀(fa)值!顺便学下语文咯。 if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }