Author:
nice01qc
Time :
Time :
Java HashMap
关于HashMap源码的一些分析(JDK版本为1.8)…
重点分析HashMap中几个重要的内部函数
1、HashMap中的hash函数
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
为什么要这样求hash值,而不用自带的hashCode()。其实这段代码相当于一个“扰动函数” ,把高位和低位信息中和在一块,避免严重的低位hash冲突。分析如下:
由于与散列值是一个int类型,只有32位,高位和低位各取一般为16位,其原理如下:
2、key的真正映射值求取
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null) // 都是通过(n-1) & hash来获取映射值
tab[i] = newNode(hash, key, value, null);
// 省略
}
原因:若通过普通的取余运算(%),效率不高,若通过简单的位操作,效率就相当高了,原理见下示例:
由于容器中数据长度为2的倍数,则 n - 1 正好相当于一个“低位掩码”,就像IPv4子网掩码中的高位掩码一样
10100101 11000100 00100101
& 00000000 00000000 00001111 (假设n为16,则n-1为15)
00000000 00000000 00000101 (高位全归为零,只保留末四位)
当数组长度为2的倍数时,另一个小优势就是,每次扩容时,旧数组中元素迁移,只需要考虑hash二进制第log(n)位是0还是1两种情况(n值位扩容后的值),详细见源码:
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
// 省略
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
// 其用处在此处
Node<K,V> loHead = null, loTail = null; // 存储那一位位0的值
Node<K,V> hiHead = null, hiTail = null; // 存储那一位位1的值
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) { // 通过&运算,判断那一位为0,还是不为零
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
3、其他一些关于位运算函数
static final int tableSizeFor(int cap) { // 使cap值为2的倍数
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
注解:关于HashMap中对红黑树的应用,见我关于平衡二叉树的博客
参考资源: