Java HashMap

关于HashMap源码的一些分析(JDK版本为1.8)…

重点分析HashMap中几个重要的内部函数

1、HashMap中的hash函数

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

为什么要这样求hash值,而不用自带的hashCode()。其实这段代码相当于一个“扰动函数” ,把高位和低位信息中和在一块,避免严重的低位hash冲突。分析如下:

由于与散列值是一个int类型,只有32位,高位和低位各取一般为16位,其原理如下:

扰动分析

2、key的真正映射值求取

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)   // 都是通过(n-1) & hash来获取映射值
        tab[i] = newNode(hash, key, value, null);
    // 省略
}

原因:若通过普通的取余运算(%),效率不高,若通过简单的位操作,效率就相当高了,原理见下示例:

由于容器中数据长度为2的倍数,则 n - 1 正好相当于一个“低位掩码”,就像IPv4子网掩码中的高位掩码一样

​ 10100101 11000100 00100101

& 00000000 00000000 00001111 (假设n为16,则n-1为15)


​ 00000000 00000000 00000101 (高位全归为零,只保留末四位)

当数组长度为2的倍数时,另一个小优势就是,每次扩容时,旧数组中元素迁移,只需要考虑hash二进制第log(n)位是0还是1两种情况(n值位扩容后的值),详细见源码:

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    // 省略
    if (oldTab != null) {
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    // 其用处在此处
                    Node<K,V> loHead = null, loTail = null;		// 存储那一位位0的值
                    Node<K,V> hiHead = null, hiTail = null;		// 存储那一位位1的值
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {	// 通过&运算,判断那一位为0,还是不为零
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

3、其他一些关于位运算函数

static final int tableSizeFor(int cap) {  // 使cap值为2的倍数
    int n = cap - 1;
    n |= n >>> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

注解:关于HashMap中对红黑树的应用,见我关于平衡二叉树的博客

参考资源:

JDK 源码中 HashMap 的 hash 方法原理是什么?

JDK1.8中HashMap中的源码