HashMap？面試都被問爛了，這些熱門面試題你都會嗎？（附答案）

前言：

這篇文章主要介紹了JAVA關於HashMap容易被提問的面試題，起因是上週日一位粉絲私聊我要面試資料時提到的一個hashmap問題，因爲好久沒看的原因，所以今天就總結一下。文中題目提問頻率高的幾道題，本人在網上總結到的，相信對你的面試有一定幫助，想要入職JAVA的朋友可以瞭解下。

1.爲什麼我們建議在定義HashMap的時候，就指定它的初始化大小呢？

答：在當我們對HashMap初始化時，如果沒有爲其設置初始化容量，那麼系統會默認創建一個容量爲16的大小的集合。當我們向HashMap中添加元素時，如果HashMap的容量值超過了它的臨界值（默認16*0.75=12）時，（0.75是HashMap的加載因子）HashMap將會重新擴容到下一個2的指數次冪（2^4=16 下一個2的指數次冪是2^5=32）。由於HashMap擴容要進行resize的操作，頻繁的resize，會導致HashMap的性能下降，所以建議在確定HashMap集合的大小的情況下，指定其初始化大小，避免做過多的resize操作，導致性能下降。

2.HashMap什麼時候進行擴容？

答：當我們不斷的向HashMap中添加元素時，它會判斷HashMap當前的容量值(當前元素的個數)是否超過了它的臨界值（在沒有指定其初始化大小時，默認16*0.75=12），如果添加的元素個數超過了臨界值，它就會開始進行擴容。

3.HashMap在擴容時，擴容到多大？

答：HashMap在擴容時，它會擴容到下一個2的指數次冪，即當前容量的2倍，比如當前容量是2^{4=16，將會擴容到下一個2的指數次冪2}5=32.

4.HashMap是如何進行擴容的？

答：HashMap進行擴容時會調用resize()函數，重新計算HashMap所需的新的容量，然後重新定義一個新的容器，將原數組數據進行Hash, 放入新的容器中。這個過程將會導致HashMap的性能下降。

resize()函數的源碼：

//HashMap 擴容操作
final Node<K,V>[] resize() {
  //保存當前table
  Node<K,V>[] oldTab = table;
  //保存當前table的容量
  int oldCap = (oldTab == null) ? 0 : oldTab.length;
  //保存當前閾值
  int oldThr = threshold;
  //初始化新的table容量和閾值
  int newCap, newThr = 0;
  
  //1. resize()函數在size(HashMap當前的元素個數) > threshold(當前閾值，默認16*0.75=12)時調用。
  //當oldCap(HashMap的元素個數)大於0表示原來的table表非空，oldCap(threshold)爲oldCap x load_factor(加載因子：0.75)
  if (oldCap > 0) {
    //若舊table容量大於等於最大容量，更新閾值爲Integer.MAX_VALUE(最大整形值)，這樣以後就不會自動擴容了
    if (oldCap >= MAXIMUM_CAPACITY) {
      threshold = Integer.MAX_VALUE;
      return oldTab;
    }
   //擴容到下一個2的指數次冪，容量翻倍，使用左移，效率更高
    else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
         oldCap >= DEFAULT_INITIAL_CAPACITY)
      newThr = oldThr << 1; // double threshold //閾值翻倍
  }
  
  //2. resize()函數在table爲空被調用。oldCap小於等於0且oldThr大於0，表示用戶使用HashMap的構造函數創建了一個HashMap，
  //使用的構造函數爲HashMap(int initialCapacity, float loadFactor)或HashMap(int initialCapacity)或HashMap(Map<? extends K, ? extends V> m)，
  //導致了oldTab爲null,oldCap爲0，oldThr爲用戶指定的HashMap的初始化容量
  else if (oldThr > 0) // initial capacity was placed in threshold
    newCap = oldThr; //當table沒有初始化時，threshold爲初始容量， threshold = tableSizeFor(t);
  
  //3. resize()函數在table爲空被調用。oldCap小於等於0且oldThr大於0，表示用戶使用HashMap的無參構造函數HashMap()函數創建了一個HashMap，
  //此時，所有值均採用默認值，oldTab(table)表爲空，oldCap爲0，oldThr等於0.
  else {        // zero initial threshold signifies using defaults
    newCap = DEFAULT_INITIAL_CAPACITY;
    newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
  }
  //如果新的閾值爲0
  if (newThr == 0) {
    float ft = (float)newCap * loadFactor; //新的tbale容量*加載因子
    newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
         (int)ft : Integer.MAX_VALUE);
  }
  threshold = newThr;
  @SuppressWarnings({"rawtypes","unchecked"})
    //初始化table
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
  table = newTab;
  if (oldTab != null) {
    //把oldTab中的節點reHash到newTab中去
    for (int j = 0; j < oldCap; ++j) {
      Node<K,V> e;
      if ((e = oldTab[j]) != null) {
        oldTab[j] = null;
      //如果節點是單個節點，直接在newTab中進行重定位
        if (e.next == null)
          newTab[e.hash & (newCap - 1)] = e;
      //如果節點是TreeNode節點，要進行紅黑樹的rehash操作
        else if (e instanceof TreeNode)
          ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
      //如果是鏈表，進行鏈表的rehash操作
        else { // preserve order
          Node<K,V> loHead = null, loTail = null;
          Node<K,V> hiHead = null, hiTail = null;
          Node<K,V> next;
        //將同一桶中的元素根據(e.hash & oldCap)是否爲0進行分割，分成兩個不同的鏈表，完成rehash操作
          do {
            next = e.next;
         //根據算法 e.hash & oldCap 判斷節點位置rehash後是否發生改變，最高位==0，這是索引不變的鏈表
            if ((e.hash & oldCap) == 0) {
              if (loTail == null)
                loHead = e;
              else
                loTail.next = e;
              loTail = e;
            }
         //最高位==1，這是索引發生改變的鏈表
            else {
              if (hiTail == null)
                hiHead = e;
              else
                hiTail.next = e;
              hiTail = e;
            }
          } while ((e = next) != null);
          if (loTail != null) { //原bucket位置的尾指針不爲空(即還有node)
            loTail.next = null;  //鏈表最後一個節點爲null
            newTab[j] = loHead; //鏈表的頭指針放在新桶的相同下標(j)處
          }
          if (hiTail != null) {
            hiTail.next = null;
            newTab[j + oldCap] = hiHead; //rehash後節點新的位置一定爲原來基礎上加上oldCap
          }
        }
      }
    }
  }
  return newTab;
}

5.爲什麼說HashMap是線程不安全的？

答：HashMap在多線程併發時線程不安全，主要表現在下面兩個方面：

(1) 當向HashMap中put(添加)元素時導致的多線程數據不一致

比如有兩個線程 A 和 B ，首先 A 希望插入一個 key-value鍵值對到HashMap 中，它首先計算記錄所要落到的 hash 桶的索引座標，然後獲取到該桶裏面的鏈表頭結點，此時線程 A 的時間片用完了，而此時線程 B 被調度得以執行，和線程 A 一樣執行，只不過線程 B 成功將記錄插到了桶裏面。假設線程 A 插入的記錄計算出來的 hash 桶索引和線程 B 要插入的記錄計算出來的 hash 桶索引是一樣的，那麼當線程 B 成功插入之後，線程 A 再次被調度運行時，它依然持有過期的鏈表頭但是它對此一無所知，以至於它認爲它應該這樣做，如此一來就覆蓋了線程 B 插入的記錄，這樣線程 B 插入的記錄就憑空消失了，造成了數據不一致的行爲。

簡單來說就是在多線程環境下，向HashMap集合中添加元素會存在覆蓋的現象，導致了線程不安全。

(2) 當HashMap進行擴容調用resize()函數時引起死循環

HashMap在put的時候，插入的元素超過了容量（由負載因子決定）的範圍就會觸發擴容操作，就是rehash，這個會重新將原數組的內容重新hash到新的擴容數組中，在多線程的環境下，存在同時其他的元素也在進行put操作，如果hash值相同，可能出現同時在同一數組下用鏈表表示，造成閉環，導致在get時會出現死循環，所以HashMap是線程不安全的。

HashMap的線程不安全主要體現在下面兩個方面：

1.在JDK1.7中，當併發執行擴容操作時會造成環形鏈和數據丟失的情況。

2.在JDK1.8中，在併發執行put操作時會發生數據覆蓋的情況。

6.說說HashMap 的數據結構

HashMap是一個key-value鍵值對的數據結構，從結構上來講在jdk1.8之前是用數組加鏈表的方式實現，jdk1.8加了紅黑樹，HashMap數組的默認初始長度是16，HashMap數組只允許一個key爲null，允許多個value爲null

HashMap的內部實現，HashMap是使用數組+鏈表+紅黑樹的形式實現的，其中數組是一個一個Node[]數組，我們叫他hash桶數組，它上面存放的是key-value鍵值對的節點。HashMap是用hash表來存儲的，在HashMap裏爲解決hash衝突，使用鏈地址法，簡單來說就是數組加鏈表的形式來解決，當數據被hash後，得到數組下標，把數據放在對應下標的鏈表中。

HashMap是基於哈希表的Map接口的非同步實現。此實現提供所有可選的映射操作，並允許使用null值和null鍵。此類不保證映射的順序，特別是它不保證該順序恆久不變。HashMap實際上是一個“鏈表散列”的數據結構，即數組和鏈表的結合體。HashMap底層就是一個數組結構，數組中的每一項又是一個鏈表。當新建一個HashMap的時候，就會初始化一個數組。HashMap主幹爲一個Entry數組，而每個Entry存放着一個鍵值對和同時指向另一個Entry的引用，如果發生哈希衝突，該引用即指向另一個Entry。

HashMap是由數組+鏈表結構組成，數組是HashMap主體，鏈表則是爲了解決哈希衝突而存在，如果對於Entry不含鏈表的位置，對其操作的時間複雜度爲O(1)，如果定位到具有鏈表的位置，則時間複雜度爲O(n)。

HashMap中重要字段:

transient int size ：實際儲存的KEY-VALUE對個數

int threshold ：閥值，當表爲空的時候，該值初始容量爲16，後期擴容使用

final float loadFactor ：負載因子，代表表的填充度，默認爲0.75

transient int modCount ：用於快速失敗，迭代時拋出異常

在JDK1.8中 HashMap底層改爲鏈表+數組+紅黑樹的形式，當Hash衝突多次在同一個位置發生的時候，（確切的說是該位置鏈表長度大於8時），在此位置將用紅黑樹來儲存數據提高讀取效率.

HashMap 包含如下幾個構造器：

HashMap()：構建一個初始容量爲 16，負載因子爲 0.75 的 HashMap。

HashMap(int initialCapacity)：構建一個初始容量爲 initialCapacity，負載因子爲 0.75 的 HashMap。

HashMap(int initialCapacity, float loadFactor)：以指定初始容量、指定的負載因子創建一個 HashMap。

HashMap的基礎構造器HashMap(int initialCapacity, float loadFactor)帶有兩個參數，它們是初始容量initialCapacity和負載因子loadFactor。

負載因子loadFactor衡量的是一個散列表的空間的使用程度，負載因子越大表示散列表的裝填程度越高，反之愈小。對於使用鏈表法的散列表來說，查找一個元素的平均時間是O(1+a)，因此如果負載因子越大，對空間的利用更充分，然而後果是查找效率的降低；如果負載因子太小，那麼散列表的數據將過於稀疏，對空間造成嚴重浪費。

HashMap的實現中，通過threshold字段來判斷HashMap的最大容量：

threshold = (int)(capacity * loadFactor);

結合負載因子的定義公式可知，threshold就是在此loadFactor和capacity對應下允許的最大元素數目，超過這個數目就重新resize，以降低實際的負載因子。默認的負載因子0.75是對空間和時間效率的一個平衡選擇。當容量超出此最大容量時， resize後的HashMap容量是容量的兩倍：

7.HashMap 的工作原理是什麼?

一，存儲方式： Java中的HashMap是以鍵值對(key-value)的形式存儲元素的。

二，調用原理： HashMap需要一個hash函數，它使用hashCode()和equals()方法來向集合/從集合添加和檢索元素。當調用put()方法的時候，HashMap會計算key的hash值，然後把鍵值對存儲在集合中合適的索引上。如果key已經存在了，value會被更新成新值。

HashMap的實現原理：

利用key的hashCode重新hash計算出當前對象的元素在數組中的下標
存儲時，如果出現hash值相同的key，此時有兩種情況。(1)如果key相同，則覆蓋原始值；(2)如果key不同（出現衝突），則將當前的key-value放入鏈表中
獲取時，直接找到hash值對應的下標，再進一步判斷key是否相同，從而找到對應值。
理解了以上過程就不難明白HashMap是如何解決hash衝突的問題，核心就是使用了數組的存儲方式，然後將衝突的key的對象放入鏈表中，一旦發現衝突就在鏈表中做進一步的對比。

純屬個人總結，如有不對的，歡迎指出！感謝諸君的支持，點個贊吧！

另外本人整理收藏了20年多家公司面試知識點整理共127頁的PDF 以及各種知識點整理免費分享給大家，想要資料的話點擊118436082暗號CSDN，或者私信我，暗號PDF。深入底層，剖析源碼。瞭解本質。愛編程，愛生活，愛分享！文章的最後祝大家在工作的工作順利，在找工作的都能拿到自己滿意的offer!

HashMap？面試都被問爛了，這些熱門面試題你都會嗎？（附答案）

前言：

lightdb hash index的性能和限制

Java類加載機制實現流程及原理詳解

HashMap？面試都被問爛了，這些熱門面試題你都會嗎？（附答案）

2020面試阿里字節跳動90%被問到的JVM面試題附答案

一口氣說出Java 6種延時隊列的實現方法(面試官也得服)

全網最經典49個Spring面試題總結(附帶答案，看完覺得經典點個贊！)

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結