HashMap 源碼剖析

如果你是要面對面試，可以直接去看下基本概念與總結
文章目錄
- HashMap 源碼剖析

1.hashmap的基本概念

hash的基本概念：把一個任意長度的基本輸入，通過一系列的hash算法映射成一個固定長度的輸出。有時候兩個不同的輸入，映射出一個相同的輸出，這種情況唄稱爲hash衝突。
hashmap的存儲結構按JDK8來說是：數組+鏈表+紅黑樹構成的。
hashmap的每一個存儲單元稱爲一個node結構。node中包含了：
key字段：map中key的字段
value字段：map中value的字段
next字段：當發生hash衝突的時候，當前桶中的node與發生衝突的node形成編標要用到的字段
hash字段：存儲key的hash值，但是要經過一次擾動

2.hashmap類

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
}

3.hashmap基本屬性

private static final long serialVersionUID = 362498820763181265L;//序列化版本號
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // 初始化長度爲16，切必須是2的N次方
static final int MAXIMUM_CAPACITY = 1 << 30;//最大的容量爲2^30，一般用於自定義初始化容量
static final float DEFAULT_LOAD_FACTOR = 0.75f;//默認負載因子
static final int TREEIFY_THRESHOLD = 8;//數組單個單元要轉化爲紅黑樹節點的閾值
static final int UNTREEIFY_THRESHOLD = 6;//反樹化時，節點的閾值
static final int MIN_TREEIFY_CAPACITY = 64;//樹化時數組長度的閾值

4.hashmap Node屬性

//hashmap中節點的基本屬性，實現get，set方法。重寫了hashCode、toString、equals方法。 屬性在上文有介紹
static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }
    //擾動函數，用於計算hash值，在之後專門專題講解。
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
    
    //在發送hash衝突的時候。用於比較兩個node。
    static Class<?> comparableClassFor(Object x) {
        if (x instanceof Comparable) {
            Class<?> c; Type[] ts, as; Type t; ParameterizedType p;
            if ((c = x.getClass()) == String.class) // bypass checks
                return c;
            if ((ts = c.getGenericInterfaces()) != null) {
                for (int i = 0; i < ts.length; ++i) {
                    if (((t = ts[i]) instanceof ParameterizedType) &&
                        ((p = (ParameterizedType)t).getRawType() ==
                         Comparable.class) &&
                        (as = p.getActualTypeArguments()) != null &&
                        as.length == 1 && as[0] == c) // type arg is c
                        return c;
                }
            }
        }
        return null;
    }
    
    static int compareComparables(Class<?> kc, Object k, Object x) {
        return (x == null || x.getClass() != kc ? 0 :
                ((Comparable)k).compareTo(x));
    }

5.hashmap 構造器原理與字段

    //用於尋找大於或等於capacity的最小2的冪
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }
    
//					字段
transient Node<K,V>[] table; //hashMap數組的表示

transient Set<Map.Entry<K,V>> entrySet; //entry節點

transient int size; //數組長度

transient int modCount; //添加的元素個數

int threshold; //合理的初始化數組長度，根據tableSizeFor()得到，用於手動設置時使用

final float loadFactor; //負載因子，用於手動設置時使用

//					構造器
//構造器一：定義Node[]數組初始長度，與負載因子
public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        //手動設定負載因子
        this.loadFactor = loadFactor;
        //自動設置合適的數組長度
        this.threshold = tableSizeFor(initialCapacity);
    }
    
//構造器二：定義Node[]數組初始長度，默認負載因子
public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }
//構造器三：僅創建HashMap對象，並初始化負債因子爲0.75f
public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }
    
//構造器四：轉化hashmap的父類
public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        //這個方法爲，將map中所有數據插入到hashmap中，此文不再描述
        putMapEntries(m, false);
    }

6.hashmap樹節點(簡要分析)

hashmap樹節點比較複雜，之後做專門的分析

static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
        TreeNode<K,V> parent;  // 父節點
        TreeNode<K,V> left;	//左節點
        TreeNode<K,V> right;//右節點
        TreeNode<K,V> prev;    // 記錄上一個節點
        boolean red;//節點紅黑判斷
        TreeNode(int hash, K key, V val, Node<K,V> next) {
            super(hash, key, val, next);
        }

7.hashmap get方法

//調用的GET方法
public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

//實際執行的GET方法
final Node<K,V> getNode(int hash, Object key) {
	Node<K,V>[] tab; 
    Node<K,V> first, e; 
    int n; K k;
    // table不爲空 && table長度大於0 && table索引位置(根據hash值計算出)節點不爲空
    if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) {
        // first的key等於傳入的key則返回first對象
        if (first.hash == hash && ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        //first的key不等於傳入的key則說明是鏈表，向下遍歷
        if ((e = first.next) != null) {
            // 判斷是否爲TreeNode，是則爲紅黑樹
            // 如果是紅黑樹節點，則調用紅黑樹的查找目標節點方法getTreeNode
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            //走下列步驟表示是鏈表，循環至節點的key與傳入的key值相等
            do {
                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    //找不到符合的返回空
    return null;
}

7.hashmap put方法

//掉用的PUT方法，hash(key)調用本例中的hash()方法
public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
}


/**
 * 實際執行的PUT方法 
 * Implements Map.put and related methods
 *
 * @param hash hash for key
 * @param key the key
 * @param value the value to put
 * @param onlyIfAbsent if true, don't change existing value
 * @param evict if false, the table is in creation mode.
 * @return previous value, or null if none
 */ 
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
    Node<K,V>[] tab;
    Node<K,V> p;
    int n, i;
    
    // table是否爲空或者length等於0, 如果是則調用resize方法進行初始化
    // table是一個 （Node<K,V>[] table;） Node類型的數組
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
        
    // 通過hash值計算索引位置, 如果table表該索引位置節點爲空則新增一個
    if ((p = tab[i = (n - 1) & hash]) == null) // 將索引位置的頭節點賦值給p
        tab[i] = newNode(hash, key, value, null);
    
    else { // table表該索引位置不爲空
        Node<K,V> e; K k;
        //判斷p節點的hash值和key值是否跟傳入的hash值和key值相等
        if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
            e = p; // 如果相等, 則p節點即爲要查找的目標節點，賦值給e
        // 判斷p節點是否爲TreeNode, 如果是則調用紅黑樹的putTreeVal方法查找目標節點
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        // 走到這代表p節點爲普通鏈表節點
        else {
            // 遍歷此鏈表, binCount用於統計節點數
            for (int binCount = 0; ; ++binCount) {
                //p.next爲空代表目標節點不存在
                if ((e = p.next) == null) {
                    //新增一個節點插入鏈表尾部
                    p.next = newNode(hash, key, value, null);
                    //如果節點數目超過8個，調用treeifyBin方法將該鏈表轉換爲紅黑樹
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                //e節點的hash值和key值都與傳入的相等, 則e即爲目標節點,跳出循環
                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        // e不爲空則代表根據傳入的hash值和key值查找到了節點,將該節點的value覆蓋,返回oldValue
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e); // 用於LinkedHashMap
            return oldValue;
        }
    }
    //map修改次數加1
    ++modCount;
    
    //map節點數加1，如果超過閥值，則擴容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict); // 用於LinkedHashMap
    return null;
}

8.hashmap resize()方法

final Node<K,V>[] resize() {
        //oldTab保存未擴容的tab
        Node<K,V>[] oldTab = table;
        //oldTab最大容量
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        //oldTab閥值
        int oldThr = threshold;
        int newCap, newThr = 0;
        //如果老map有值
        if (oldCap > 0) {
            // 老table的容量超過最大容量值，設置閾值爲Integer.MAX_VALUE，返回老表
            if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            //老table的容量沒有超過最大容量值，將新容量賦值爲老容量*2，如果新容量<最大容量並且老容量>=16, 則將新閾值設置爲原來的兩倍
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                    oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }else if (oldThr > 0){ // 老表的容量爲0, 老表的閾值大於0, 是因爲初始容量被放入閾值
            newCap = oldThr;    // 則將新表的容量設置爲老表的閾值
        //放第一個值時，對數組容量及閾值進行初始化。
        }else {   //老表的容量爲0, 老表的閾值爲0, 則爲空表，設置默認容量和閾值
            newCap = DEFAULT_INITIAL_CAPACITY; //16
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); //12
        }
        // 如果新閾值爲空, 則通過新的容量*負載因子獲得新閾值
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE);
        }
        // 將當前閾值賦值爲剛計算出來的新的閾值
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        //初始化數組對象
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        //將當前的表賦值爲新定義的表
        table = newTab;  
        // 如果老表不爲空, 則需遍歷將節點賦值給新表
        if (oldTab != null) {
            //通過循環將老數組重新賦值給新數組
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) { // 將索引值爲j的老表頭節點賦值給e
                    oldTab[j] = null; //將老表的節點設置爲空, 以便垃圾收集器回收空間
                    // 如果e.next爲空, 則代表老表的該位置只有1個節點,
                    // 通過hash值計算新表的索引位置, 直接將該節點放在該位置
                    if (e.next == null) //
                        newTab[e.hash & (newCap - 1)] = e;
                    //e.next不爲空,判斷是否是紅黑樹
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    //是普通鏈表
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            //如果e的hash值與老表的容量進行與運算爲0,則擴容後的索引位置跟老表的索引位置一樣
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            //如果e的hash值與老表的容量進行與運算爲1,則擴容後的索引位置爲:
                            //	老表的索引位置＋oldCap
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null; // 最後一個節點的next設爲空
                            newTab[j] = loHead; // 將原索引位置的節點設置爲對應的頭結點
                        }
                        if (hiTail != null) {
                            hiTail.next = null; // 最後一個節點的next設爲空
                            newTab[j + oldCap] = hiHead; // 將索引位置爲原索引+oldCap的節點設置爲對應的頭結點
                        }
                    }
                }
            }
        }
        return newTab;
    }

9.hashmap remove()方法

public V remove(Object key) {
    Node<K,V> e;
    return (e = removeNode(hash(key), key, null, false, true)) == null ?
        null : e.value;
}

final Node<K,V> removeNode(int hash, Object key, Object value,
                           boolean matchValue, boolean movable) {
    Node<K,V>[] tab; Node<K,V> p; int n, index;
    // 如果table不爲空並且根據hash值計算出來的索引位置不爲空, 將該位置的節點賦值給p
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (p = tab[index = (n - 1) & hash]) != null) {
        Node<K,V> node = null, e; K k; V v;
        // 如果p的hash值和key都與入參的相同, 則p即爲目標節點, 賦值給node
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            node = p;
        else if ((e = p.next) != null) {    // 否則向下遍歷節點
            if (p instanceof TreeNode)  // 如果p是TreeNode則調用紅黑樹的方法查找節點
                node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
            else {
                do {    // 遍歷鏈表查找符合條件的節點
                    // 當節點的hash值和key與傳入的相同,則該節點即爲目標節點
                    if (e.hash == hash &&
                        ((k = e.key) == key ||
                         (key != null && key.equals(k)))) {
                        node = e;    // 賦值給node, 並跳出循環
                        break;
                    }
                    p = e;  // p節點賦值爲本次結束的e
                } while ((e = e.next) != null); // 指向像一個節點
            }
        }
        // 如果node不爲空(即根據傳入key和hash值查找到目標節點)，則進行移除操作
        if (node != null && (!matchValue || (v = node.value) == value ||
                             (value != null && value.equals(v)))) { 
            if (node instanceof TreeNode)   // 如果是TreeNode則調用紅黑樹的移除方法
                ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
            // 走到這代表節點是普通鏈表節點
            // 如果node是該索引位置的頭結點則直接將該索引位置的值賦值爲node的next節點
            else if (node == p)
                tab[index] = node.next;
            // 否則將node的上一個節點的next屬性設置爲node的next節點, 
            // 即將node節點移除, 將node的上下節點進行關聯(鏈表的移除)    
            else 
                p.next = node.next;
            ++modCount; // 修改次數+1
            --size; // table的總節點數-1
            afterNodeRemoval(node); // 供LinkedHashMap使用
            return node;    // 返回被移除的節點
        }
    }
    return null;
}

總結篇

在JDK8 HashMap使用的是懶加載模式，也就是說，在默認初始化hashmap的時候，並不會在內存中創建一個長度爲16的數組。而是在第一次put數據的時候纔會創建。
負載因子的作用：默認負載因子爲0.75.也就是說，hashmap在put數據的時候，發現數組中75%的index中都有了數據，就會進行一次擴容。每一次擴容大小均爲2^n。(默認情況下，首次初始化數組長度爲16，那麼擴容閾值就位12)
鏈表轉化爲紅黑樹的條件：1.單個index中的鏈表長度超過8。 2.當前散列表長度打到64。
put算法：
1、對比hash值。如果節點已經存在，則更新原值。
2、如果節點不存在，則插入數組中，如果數組已經有值，則判斷是否是紅黑樹，如果是，則調用紅黑樹方法插入
3、如果插入的是鏈表，插入尾部，然後判斷節點數是否超過8，如果超過，則轉換爲紅黑樹
4、先插入的數據，後面判斷是否超過閥值再進行的擴容

HashMap 源碼剖析

HashMap 源碼剖析

文章目錄

1.hashmap的基本概念

2.hashmap類

3.hashmap基本屬性

4.hashmap Node屬性

5.hashmap 構造器原理與字段

6.hashmap樹節點(簡要分析)

7.hashmap get方法

7.hashmap put方法

8.hashmap resize()方法

9.hashmap remove()方法

總結篇

那些年走過的azkaban的坑

Hadoop Apache 2.7.2 安裝教程

Flume在修改文件名後會重複讀取文件問題

Spark任務運行流程(基於yarn集羣模式)源碼分析（1）

Zookeeper 3.4.10安裝教程

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結