基本數據
JDK8的HashMap在內部實現上使用數組+鏈表+紅黑樹三種數據結構。
對於hash衝突,HashMap的解決是使用鏈地址法,將hash相同的記錄放在同一個數組位置上,多個hash相同的記錄被存儲在一同鏈上。
鏈表節點
static class Node<K,V> implements Map.Entry<K,V> {
final int hash; //哈希值,HashMap用這個值來確定記錄的位置
final K key; //記錄key
V value; //記錄value
Node<K,V> next;//鏈表下一個節點
······
}
Node數組
transient Node<K,V>[] table;
//鍵值對數目
transient int size;
//作爲擴容的閾值
int threshold;
//負載因子
final float loadFactor;
//默認容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
//最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
//默認負載因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
HashMaptable大小默認是2的n次方,初始大小爲16
計算最接近2的n次方:
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
確定記錄的table位置
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
首先計算出hash值,然後和table的長度取餘來定位index。
取模的步驟是複雜的耗時的,但是將table的長度設置爲2的n次方,在計算index的時候就可以通過下面算法進行:
int index = hashCode & (length -1)
put方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
- 首先判空或長度爲0,然後通過resize進行初始化。resize用在初始化和擴容。
- 計算hashcode及index,如果發現對應的值爲null,則直接放入。
- 若不爲空且記錄和index的記錄相等,則直接覆蓋。
- 如果這個index上的節點是TreeNode,那麼說明是一個紅黑樹,然後將其插入對應紅黑樹中。
- 如果這個節點類型不是TreeNode,說明衝突閾值還沒有達到閾值。如果這個記錄是新的會插入最尾部,負責將替換舊的記錄。如果插入後達到閾值,則將其轉化爲一個紅黑樹。
- 檢查哈希桶是否達到閾值,如果達到了,調用resize擴容。
resize擴容
final Node<K, V>[] resize() {
Node<K, V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) { //如果舊的容量比最大容量要大,那就不再散列,直接返回舊的散列表
threshold = Integer.MAX_VALUE;
return oldTab;
} else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold 兩倍的閾值,通過位運算向左移位得到
} else if (oldThr > 0) // initial capacity was placed in threshold 如果舊的閾值 > 0,數組的新容量設置爲就數組的閾值。
newCap = oldThr;
else { // zero initial threshold signifies using defaults
//第一次初始化散列表的操作
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int) (DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float) newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float) MAXIMUM_CAPACITY ?
(int) ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes", "unchecked"})
Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCap];
table = newTab;
//將舊的散列表複製到新的散列表。
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K, V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode) //如果是紅黑樹,這樣操作
((TreeNode<K, V>) e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K, V> loHead = null, loTail = null; //如果是鏈表,這樣操作
Node<K, V> hiHead = null, hiTail = null;
Node<K, V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
} else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
每次擴容會增大當前容量的兩倍。如果Hash的容量已經達到最大值了那麼就不會在進行擴容了。
在遷移內容時
table的長度確保是2的n次方,每次擴容容量變爲原來的兩倍,那麼一個記錄在新table中的位置要麼就和原來一樣,要麼就需要遷移到(oldCap + index)的位置上。
get方法
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
- 得到當前table對應該index的記錄,如果爲null,說明沒有記錄落在該位置上,直接返回null。
- 如果不爲null,則說明至少有一個記錄,如果使我們查找的記錄,那麼直接返回,否則判斷該記錄是鏈表還是一個紅黑樹來分別查找需要的記錄。
remove方法
public V remove(Object key) {
Node<K,V> e;
return (e = removeNode(hash(key), key, null, false, true)) == null ?
null : e.value;
}
final Node<K, V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
Node<K, V>[] tab;
Node<K, V> p;
int n, index;
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) { //判斷桶是否爲空,映射的哈希值是否存在
Node<K, V> node = null, e;
K k;
V v;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k)))) //如果是在首位找到就記錄下來
node = p;
else if ((e = p.next) != null) { //不在首位則到紅黑樹或者鏈表中尋找
if (p instanceof TreeNode)
node = ((TreeNode<K, V>) p).getTreeNode(hash, key);
else {
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) { //如果找到了對應的結點,並且確定了value也對得上,就開始進行刪除
if (node instanceof TreeNode) //紅黑樹的刪除
((TreeNode<K, V>) node).removeTreeNode(this, tab, movable);
else if (node == p) //鏈表的刪除
tab[index] = node.next;
else
p.next = node.next; //桶首位的刪除
++modCount;
--size;
afterNodeRemoval(node);
return node;
}
}
return null;
}
換湯不換藥,其實 removeNode()方法,前面幾步 get()方法沒什麼區別,主要在於後面執行刪除的時候要把value做一次判斷。