HashMap源碼分析整理

基本數據

JDK8的HashMap在內部實現上使用數組+鏈表+紅黑樹三種數據結構。
在這裏插入圖片描述
對於hash衝突,HashMap的解決是使用鏈地址法,將hash相同的記錄放在同一個數組位置上,多個hash相同的記錄被存儲在一同鏈上。

鏈表節點

    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash; //哈希值,HashMap用這個值來確定記錄的位置
        final K key; //記錄key
        V value; //記錄value
        Node<K,V> next;//鏈表下一個節點
		······
    }

Node數組

transient Node<K,V>[] table;

    //鍵值對數目
    transient int size;
    //作爲擴容的閾值
    int threshold;    
     //負載因子
    final float loadFactor;   
    //默認容量
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16   
    //最大容量
    static final int MAXIMUM_CAPACITY = 1 << 30; 
    //默認負載因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

HashMaptable大小默認是2的n次方,初始大小爲16

計算最接近2的n次方:

    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

確定記錄的table位置

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

首先計算出hash值,然後和table的長度取餘來定位index。

取模的步驟是複雜的耗時的,但是將table的長度設置爲2的n次方,在計算index的時候就可以通過下面算法進行:

int index = hashCode & (length -1)

put方法

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

在這裏插入圖片描述

  • 首先判空或長度爲0,然後通過resize進行初始化。resize用在初始化和擴容。
  • 計算hashcode及index,如果發現對應的值爲null,則直接放入。
  • 若不爲空且記錄和index的記錄相等,則直接覆蓋。
  • 如果這個index上的節點是TreeNode,那麼說明是一個紅黑樹,然後將其插入對應紅黑樹中。
  • 如果這個節點類型不是TreeNode,說明衝突閾值還沒有達到閾值。如果這個記錄是新的會插入最尾部,負責將替換舊的記錄。如果插入後達到閾值,則將其轉化爲一個紅黑樹。
  • 檢查哈希桶是否達到閾值,如果達到了,調用resize擴容。

resize擴容

 final Node<K, V>[] resize() {
     Node<K, V>[] oldTab = table;
     int oldCap = (oldTab == null) ? 0 : oldTab.length;
     int oldThr = threshold;
     int newCap, newThr = 0;
     if (oldCap > 0) {
         if (oldCap >= MAXIMUM_CAPACITY) { //如果舊的容量比最大容量要大,那就不再散列,直接返回舊的散列表
             threshold = Integer.MAX_VALUE;
             return oldTab;
         } else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
             newThr = oldThr << 1; // double threshold 兩倍的閾值,通過位運算向左移位得到
     } else if (oldThr > 0) // initial capacity was placed in threshold  如果舊的閾值 > 0,數組的新容量設置爲就數組的閾值。
         newCap = oldThr;
     else {               // zero initial threshold signifies using defaults
         //第一次初始化散列表的操作
         newCap = DEFAULT_INITIAL_CAPACITY; 
         newThr = (int) (DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
     }
     if (newThr == 0) {
         float ft = (float) newCap * loadFactor;
         newThr = (newCap < MAXIMUM_CAPACITY && ft < (float) MAXIMUM_CAPACITY ?
                 (int) ft : Integer.MAX_VALUE);
     }
     threshold = newThr;
     @SuppressWarnings({"rawtypes", "unchecked"})
     Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCap];
     table = newTab;
     //將舊的散列表複製到新的散列表。
     if (oldTab != null) {
         for (int j = 0; j < oldCap; ++j) {
             Node<K, V> e;
             if ((e = oldTab[j]) != null) {
                 oldTab[j] = null;
                 if (e.next == null)
                     newTab[e.hash & (newCap - 1)] = e;
                 else if (e instanceof TreeNode)  //如果是紅黑樹,這樣操作
                     ((TreeNode<K, V>) e).split(this, newTab, j, oldCap);
                 else { // preserve order
                     Node<K, V> loHead = null, loTail = null;  //如果是鏈表,這樣操作
                     Node<K, V> hiHead = null, hiTail = null;
                     Node<K, V> next;
                     do {
                         next = e.next;
                         if ((e.hash & oldCap) == 0) {
                             if (loTail == null)
                                 loHead = e;
                             else
                                 loTail.next = e;
                             loTail = e;
                         } else {
                             if (hiTail == null)
                                 hiHead = e;
                             else
                                 hiTail.next = e;
                             hiTail = e;
                         }
                     } while ((e = next) != null);
                     if (loTail != null) {
                         loTail.next = null;
                         newTab[j] = loHead;
                     }
                     if (hiTail != null) {
                         hiTail.next = null;
                         newTab[j + oldCap] = hiHead;
                     }
                 }
             }
         }
     }
     return newTab;
 }

每次擴容會增大當前容量的兩倍。如果Hash的容量已經達到最大值了那麼就不會在進行擴容了。

在遷移內容時

table的長度確保是2的n次方,每次擴容容量變爲原來的兩倍,那麼一個記錄在新table中的位置要麼就和原來一樣,要麼就需要遷移到(oldCap + index)的位置上。

get方法

    public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

    final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }
  • 得到當前table對應該index的記錄,如果爲null,說明沒有記錄落在該位置上,直接返回null。
  • 如果不爲null,則說明至少有一個記錄,如果使我們查找的記錄,那麼直接返回,否則判斷該記錄是鏈表還是一個紅黑樹來分別查找需要的記錄。

remove方法

    public V remove(Object key) {
        Node<K,V> e;
        return (e = removeNode(hash(key), key, null, false, true)) == null ?
            null : e.value;
    }

    final Node<K, V> removeNode(int hash, Object key, Object value,
                                boolean matchValue, boolean movable) {
        Node<K, V>[] tab;
        Node<K, V> p;
        int n, index;
        if ((tab = table) != null && (n = tab.length) > 0 &&
                (p = tab[index = (n - 1) & hash]) != null) { //判斷桶是否爲空,映射的哈希值是否存在
            Node<K, V> node = null, e;
            K k;
            V v;
            if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k)))) //如果是在首位找到就記錄下來
                node = p;
            else if ((e = p.next) != null) { //不在首位則到紅黑樹或者鏈表中尋找
                if (p instanceof TreeNode)
                    node = ((TreeNode<K, V>) p).getTreeNode(hash, key);
                else {
                    do {
                        if (e.hash == hash &&
                                ((k = e.key) == key ||
                                        (key != null && key.equals(k)))) {
                            node = e;
                            break;
                        }
                        p = e;
                    } while ((e = e.next) != null);
                }
            }
            if (node != null && (!matchValue || (v = node.value) == value ||
                    (value != null && value.equals(v)))) {  //如果找到了對應的結點,並且確定了value也對得上,就開始進行刪除
                if (node instanceof TreeNode) //紅黑樹的刪除
                    ((TreeNode<K, V>) node).removeTreeNode(this, tab, movable);
                else if (node == p) //鏈表的刪除
                    tab[index] = node.next;
                else
                    p.next = node.next; //桶首位的刪除
                ++modCount;
                --size;
                afterNodeRemoval(node);
                return node;
            }
        }
        return null;
    }

換湯不換藥,其實 removeNode()方法,前面幾步 get()方法沒什麼區別,主要在於後面執行刪除的時候要把value做一次判斷。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章