※HashMap底層實現原理(全)

HashMap底層實現原理（上）

本來想先在專欄裏簡單的說一下二叉樹，紅黑樹的內容後再說HashMap的，但看到評論區裏不斷的出現HashMap這個詞，怕大家等得着急，本篇文章就先說說HashMap吧，前面講ArrayList和LinkedList時把源碼說得很細，只要理解了這兩塊內容，本篇內容也很好理解，先來看看HashMap在Map這個大家族中的位置。

上圖中，白色部分是接口，黃色部分是要重點了解的，最好是看一遍源碼，綠色部分已經過時，不常用了，但是面試中可能會問到。這裏先簡單的說一下這幾個Map，TreeMap是基於樹的實現，HashMap，HashTable，ConcurrentHashMap是基於hash表的實現，下文我們會介紹hash表。HashTable和HashMap在代碼實現上，基本上是一樣的，和Vector與Arraylist的區別大體上差不多，一個是線程安全的，一個非線程安全，忘記了的朋友可以去看這篇文章，傳送門：Arraylist與Vector的區別。ConcurrentHashMap也是線程安全的，但性能比HashTable好很多，HashTable是鎖整個Map對象，而ConcurrentHashMap是鎖Map的部分結構，LinkedHashMap後續會單獨開文講解。

Map其實很簡單，就是一個key，對應一個value。本章我們重點了解HashMap，話不多說，上代碼：

執行構造函數，當我們看到這個new，第一反應應該是這貨又在堆內存裏開闢了一塊空間。

構造函數如下：

似乎簡單，就是初始化了一個負載因子

負載因子默認爲0.75f，這個負載因子後續會詳說。

嘿嘿，又看到了傳說中的數組，數組裏原對象是Node，來看一下Node是什麼鬼

其實很簡單，一些屬性，一個key，一個value，用來保存我們往Map裏放入的數據，next用來標記Node節點的下一個元素。目前還沒有任何代碼用到Node，我們只能從成員變量入手了

這兩個就不多說了吧，一個是邏輯長度，一個是修改次數，ArrayList，LinkedList也有這兩個屬性，老規矩，我們來畫一畫

HashMap我們就初始化好了，成員變量table數組默認爲null，size默認爲0，負載因子爲0.75f，初始化完成，往裏添加元素，來看一下put的源碼

就一行代碼，調用了putVal方法，其中key是傳進來的“張三”這個字符串對象，value是“張三”這個Person對象，調用了一個方法hash()，再看一下

看到了熟悉的hashCode，我們在前面的文章裏已經強調過很多次了，重寫equals方法的時候，一定要重寫hashCode方法，因爲key是基於hashCode來處理的。繼續看putVal方法

resize方法比較複雜，這兒就不完全貼出來了，當放入第一個元素時，會觸發resize方法的以下關鍵代碼

再看這個DEFAULT_INITIAL_CAPACITY是什麼東東

又是傳說中的移位運算符，1 << 4 其實就是相當於16。

恩，這句是關鍵，當我們放入第一個元素時，如果底層數組還是null，系統會初始化一個長度爲16的Node數組，像極了ArrayList的初始化。

最後返回new出來的數組，繼續畫圖，由於篇幅有限，下圖中省略了部分數組內容，注意，雖然數組長度爲16，但邏輯長度size依然是0

繼續執行下圖中putVal方法裏的紅框內容

if ((p = tab[i = (n - 1) & hash]) == null)
    tab[i] = newNode(hash, key, value, null);

這段代碼初學者可能看起來比較費勁，我們重寫一下以便初學者能更好的理解，這兩段代碼等同，下面是重寫後的代碼，清晰了很多

i = (n - 1) & hash;//hash是傳過來的，其中n是底層數組的長度，用&運算符計算出i的值 
p = tab[i];//用計算出來的i的值作爲下標從數組中元素
if(p == null){//如果這個元素爲null，用key,value構造一個Node對象放入數組下標爲i的位置
     tab[i] = newNode(hash, key, value, null);
}

這個hash值是字符串“張三”這個對象的hashCode方法與hashMap提供hash()方法共同計算出來的結果，其中n是數組的長度，目前數組長度爲16，不管這個hash的值是多少，經過(n - 1) & hash計算出來的i 的值一定在n-1之間。剛好是底層數組的合法下標，用i這個下標值去底層數組裏去取值，如果爲null，創建一個Node放到數組下標爲i的位置。這裏的“張三”計算出來的i的值爲2，繼續畫圖

繼續添加元素“李四”，“王五”，“趙六”，一切正常，key：“李四”經過(n - 1) & hash算出來在數組下標位置爲1，“王五”爲7，“趙六”爲9，添加完成後如下圖

上圖更趨近於堆內存中的樣子，但看起來比較複雜，我們簡化一下

上圖是簡化後的堆內存圖。繼續往裏添加“孫七”，通過(n - 1) & hash計算“孫七”這個key時計算出來的下標值是1，而數組下標1這個位置目前已經被“李四”給佔了，產生了衝突。相信大家在看本文的過程中也有這樣的疑惑，萬一計算出來的下標值i重了怎麼辦？我們來看一看HashMap是怎麼解決衝突的。

上圖中紅框裏就是衝突的處理，這一句是關鍵

p.next = newNode(hash, key, value, null);

也就是說new一個新的Node對象並把當前Node的next引用指向該對象，也就是說原來該位置上只有一個元素對象，現在轉成了單向鏈表，繼續畫圖

繼續添加其它元素，添加完成後如下

到這裏，我們的元素就添加完了。我們debug看一下

大框裏的內容是鏈表的體現，小框裏的內容是單元素的體現。

紅框中還有兩行比較重要的代碼

if (binCount >= TREEIFY_THRESHOLD - 1) //當binCount>=TREEIFY_THRESHOLD-1
      treeifyBin(tab, hash);//把鏈表轉化爲紅黑樹

再看看TREEIFY_THRESHOLD的值

當鏈表長度到8時，將鏈表轉化爲紅黑樹來處理，由於樹相關的內容本專欄還未講解，紅黑樹的內容這裏就不深入了。樹在內存中的樣子我們還是畫個圖簡單的瞭解一下

在JDK1.7及以前的版本中，HashMap裏是沒有紅黑樹的實現的，在JDK1.8中加入了紅黑樹是爲了防止哈希表碰撞攻擊，當鏈表鏈長度爲8時，及時轉成紅黑樹，提高map的效率。在面試過程中，能說出這一點，面試官會對你加分不少。

注：本章所講的移位運算符（如：“<<”）、位運算符（如：“&”），紅黑樹、哈希表碰撞攻擊等，這裏不做詳解，大家有興趣的話請在評論區留言，響應的人多的話，會單獨開文講解。

思考下面代碼：

hash方法的實現：

在put放入元素時，HashMap又自己寫了一個hash方法來計算hash值，大家想想看，爲什麼不用key本身的hashCode方法，而是又處理了一下？

本文到這裏先告一個段落，先做一個小結。

HashMap的最底層是數組來實現的，數組裏的元素可能爲null，也有可能是單個對象，還有可能是單向鏈表或是紅黑樹。

文中的resize在底層數組爲null的時候會初始化一個數組，不爲null的情況下會去擴容底層數組，並會重排底層數組裏的元素。

HashMap底層實現原理（下）

上一篇文章我們介紹了HashMap的底層實現，但還遺留了一點內容，我們再回顧一下上一篇文章裏說的內容

執行完紅框裏的代碼，personMap裏放入了8個元素，放置完成後在堆內存表現如下圖

如果忽略底層實現細節，是這樣的

在Map中，一個key，對應了一個value，如果key的值已經存在，Map會直接替換value的內容，來看一下源碼中是怎麼實現的，來看以下代碼

Person oldPerson1 = personMap.put("張三", new Person("新張三", 21));
Person oldPerson2 = personMap.put("孫七", new Person("新孫七", 32));

System.out.println("oldPerson1.getName() ：" + oldPerson1.getName());
System.out.println("oldPerson2.getName() : " + oldPerson2.getName());
System.out.println("personMap.size() : " + personMap.size());

new了一個Person“新張三”，注意，key依然是張三，看一下源碼

放入“新張三”時，會執行以上代碼1、2、5

if ((p = tab[i = (n - 1) & hash]) == null)
    tab[i] = newNode(hash, key, value, null);

上面這段代碼在上一篇文章已經改寫過了，改寫後的代碼如下：

i = (n - 1) & hash;//hash是傳過來的，其中n是底層數組的長度，用&運算符計算出i的值 
p = tab[i];//用計算出來的i的值作爲下標從數組中元素
if(p == null){//這兒P不爲null，所以下面這行代碼不會執行。
     tab[i] = newNode(hash, key, value, null);//這行代碼不會執行
}

很簡單，直接在底層數組裏取值賦值給p，由於p不爲null，執行else裏的邏輯

Node<K,V> e; K k;
if (p.hash == hash &&  //如果hash值相等，key也相等，或者equals相等，賦值給e
     ((k = p.key) == key || (key != null && key.equals(k))))
      e = p;//賦值給e

又看到了熟悉的equals方法，這裏我們hash值相等，key的值也相等，條件成立，把值賦值給e。（如果key的值不相等，就比較equals方法，也就是說，就算key是一個新new出來的對象，只要滿足equals，也視爲key相同）

if (e != null) { // existing mapping for key
     V oldValue = e.value;//定義一個變量來存舊值
     if (!onlyIfAbsent || oldValue == null)
     e.value = value;//把value的值賦值爲新的值
     afterNodeAccess(e);
     return oldValue;//返回的值
}

這段代碼就比較簡單了，用新的value替換舊value並返回舊的value。畫一下圖

再new一個Person“新孫七”並put到personMap中，注意，key依然是“孫七”，會執行圖17-2裏的1、2、3、4、5，由於2、3不滿足條件，實際執行的是1、4、5，1這一步已經說過了，重點說一下4這一步

for (int binCount = 0; ; ++binCount) {//循環
    if ((e = p.next) == null) {//如果循環到最後也沒找到，把元素放到最後
        p.next = newNode(hash, key, value, null);//把元素放到最後
        if (binCount >= TREEIFY_THRESHOLD - 1) //如果長度超>=8，轉換成紅黑樹
            treeifyBin(tab, hash);//轉換成紅黑樹
            break;
        }
        if (e.hash == hash && //這段代碼和第2步一樣
            ((k = e.key) == key || (key != null && key.equals(k))))
            break;
            p = e;//如果hash值相等，key也相等或者equals相等，賦值給e
        }
    }
}

其實就是循環鏈表的節點，直到找到"孫七"這個key，然後執行圖17-2裏的第5步，如果找不到，就添加到最後，這裏我們key是“孫七”，在鏈表中找到元素替換value即可，再畫一下圖

最後來看看放到樹裏的方法putTreeVal，由於樹的內容我們還沒涉及到，下面只標註出了關鍵代碼

和鏈表類似，循環（遍歷）樹的節點，如果找到節點，返回節點，執行圖17-2裏的第5步更新value。如果循環完整顆數都找不到相應的key，添加新節點。

最後我們看一下本文初那段示例代碼的執行結果：

雖然元素已經替換成新的值，但示例中打印的是替換前的值，元素個數還是8不變，debug看一下，是不是value更新成功了

更新已經成功。

結合上一篇內容，做一個總結，在hashMap中放入（put）元素，有以下重要步驟：

1、計算key的hash值，算出元素在底層數組中的下標位置。

2、通過下標位置定位到底層數組裏的元素（也有可能是鏈表也有可能是樹）。

3、取到元素，判斷放入元素的key是否==或equals當前位置的key，成立則替換value值，返回舊值。

4、如果是樹，循環樹中的節點，判斷放入元素的key是否==或equals節點的key，成立則替換樹裏的value，並返回舊值，不成立就添加到樹裏。

5、否則就順着元素的鏈表結構循環節點，判斷放入元素的key是否==或equals節點的key，成立則替換鏈表裏value，並返回舊值，找不到就添加到鏈表的最後。

精簡一下，判斷放入HashMap中的元素要不要替換當前節點的元素，key滿足以下兩個條件即可替換：

1、hash值相等。

2、==或equals的結果爲true。

由於hash算法依賴於對象本身的hashCode方法，所以對於HashMap裏的元素來說，hashCode方法與equals方法非常的重要，這也是在說說Java裏的equals（中）一文中強調重寫對象的equals方法一定要重寫hashCode方法的原因，不重寫的話，放到HashMap中可能會得不到你想要的結果！本示例中放入的key是String類型的，String這個類已經重寫了hashCode方法，有興趣的朋友可以自行查看源碼。

擴容resize()方法源碼看：

https://blog.csdn.net/truelove12358/article/details/106423200

作者原文知乎專欄：https://zhuanlan.zhihu.com/p/28501879

※HashMap底層實現原理(全)

DAPPER 事務 TRANSACTION

分佈式事務精華總結篇

Java併發之AQS原理淺析

Java線程池【二】深入分析,Java線程池實現原理及其在美團業務中的實踐

Java線程池【一】實現原理

負載均衡比較：LVS，HAProxy和Nginx

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結