HashMap常見問題整理

一、HashMap實現原理

你看過HashMap源碼嘛,知道原理嘛?

在這裏插入圖片描述
HashMap採用Entry數組來存儲key-value對,每一個鍵值對組成了一個Entry實體,Entry類實際上是一個單向的鏈表結構,它具有Next指針,可以連接下一個Entry實體。
只是在JDK1.8中,鏈表長度大於8的時候,鏈表會轉成紅黑樹!

爲什麼用數組+鏈表?

數組是用來確定桶的位置,利用元素的key的hash值對數組長度取模得到.
鏈表是用來解決hash衝突問題,當出現hash值一樣的情形,就在數組上的對應位置形成一條鏈表

hash衝突你還知道哪些解決辦法?

比較出名的有四種:開放定址法、鏈地址法、再哈希法、公共溢出區域法

  • 開放地址法
    從發生衝突的那個單元起,按照一定的次序,從哈希表中找到一個空閒的單元。然後把發生衝突的元素存入到該單元的一種方法。開放定址法需要的表長度要大於等於所需要存放的元素。

  • 再散列
    當發生衝突時,使用第二個、第三個、哈希函數計算地址,直到無衝突時。缺點:計算時間增加。

  • 鏈接地址法的思路是將哈希值相同的元素構成一個同義詞的單鏈表,並將單鏈表的頭指針存放在哈希表的第i個單元中,查找、插入和刪除主要在同義詞鏈表中進行。在java中,鏈接地址法也是HashMap解決哈希衝突的方法之一。

  • 公共溢出區域法
    將哈希表分爲公共表和溢出表,當溢出發生時,將所有溢出數據統一放到溢出區。

我用LinkedList代替數組結構可以麼?

答案很明顯,必須是可以的。
既然是可以的,爲什麼HashMap不用LinkedList,而選用數組?
因爲用數組效率最高!
在HashMap中,定位桶的位置是利用元素的key的哈希值對數組長度取模得到。此時,我們已得到桶的位置。顯然數組的查找效率比LinkedList大。

既然是可以的,爲什麼HashMap不用LinkedList,而選用數組?

因爲採用基本數組結構,擴容機制可以自己定義,HashMap中數組擴容剛好是2的次冪,在做取模運算的效率高。
而ArrayList的擴容機制是1.5倍擴容,那ArrayList爲什麼是1.5倍擴容這就不在本文說明了。

二、HashMap在什麼條件下擴容

HashMap在什麼條件下擴容

如果bucket滿了(超過load factor*current capacity),就要resize。
load factor爲0.75,爲了最大程度避免哈希衝突
current capacity爲當前數組大小。

爲什麼擴容是2的次冪

HashMap爲了存取高效,要儘量較少碰撞,就是要儘量把數據分配均勻,每個鏈表長度大致相同,這個實現就在把數據存到哪個鏈表中的算法;這個算法實際就是取模,hash%length。
但是,大家都知道這種運算不如位移運算快。
因此,源碼中做了優化hash&(length-1)。
也就是說hash%length==hash&(length-1)
位運算比較高效,當b爲2的n次方時,有如下替換公式:
a % b = a & (b-1)(b=2n)
即:a % 2n = a & (2n-1)

爲什麼爲什麼要先高16位異或低16位再取模運算

hashmap這麼做,只是爲了降低hash衝突的機率。

比如,當我們的length爲16的時候,哈希碼(字符串“abcabcabcabcabc”的key對應的哈希碼)對(16-1)與操作,對於多個key生成的hashCode,只要哈希碼的後4位爲0,不論不論高位怎麼變化,最終的結果均爲0。
如下圖所示
在這裏插入圖片描述
而加上高16位異或低16位的“擾動函數”後,結果如下

在這裏插入圖片描述

三、hashmap的get/put的過程

知道hashmap中put元素的過程是什麼樣嗎

對key的hashCode()做hash運算,計算index;
如果沒碰撞直接放到bucket裏;
如果碰撞了,以鏈表的形式存在buckets後;
如果碰撞導致鏈表過長(大於等於TREEIFY_THRESHOLD),就把鏈表轉換成紅黑樹(JDK1.8中的改動);
如果節點已經存在就替換old value(保證key的唯一性)
如果bucket滿了(超過load factor*current capacity),就要resize。

知道hashmap中get元素的過程是什麼樣嗎

對key的hashCode()做hash運算,計算index;
如果在bucket裏的第一個節點裏直接命中,則直接返回;
如果有衝突,則通過key.equals(k)去查找對應的Entry;
若爲樹,則在樹中通過key.equals(k)查找,O(logn);
若爲鏈表,則在鏈表中通過key.equals(k)查找,O(n)。

你還知道哪些hash算法?

先說一下hash算法幹嘛的,Hash函數是指把一個大範圍映射到一個小範圍。把大範圍映射到一個小範圍的目的往往是爲了節省空間,使得數據容易保存。
比較出名的有MurmurHash、MD4、MD5等等

說說String中hashcode的實現?(此題頻率很高)

public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;

        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}

String類中的hashCode計算方法還是比較簡單的,就是以31爲權,每一位爲字符的ASCII值進行運算,用自然溢出來等效取模。

主要是因爲31是一個奇質數,所以31i=32i-i=(i<<5)-i,這種位移與減法結合的計算相比一般的運算快很多。

四、爲什麼hashmap的在鏈表元素數量超過8時改爲紅黑樹

知道jdk1.8中hashmap改了啥嗎

  • 由數組+鏈表的結構改爲數組+鏈表+紅黑樹。
  • 優化了高位運算的hash算法:h^(h>>>16)
  • 擴容後,元素要麼是在原位置,要麼是在原位置再移動2次冪的位置,且鏈表順序不變。

最後一條是重點,因爲最後一條的變動,hashmap在1.8中,不會在出現死循環問題。

爲什麼在解決hash衝突的時候,不直接用紅黑樹?而選擇先用鏈表,再轉紅黑樹

因爲紅黑樹需要進行左旋,右旋,變色這些操作來保持平衡,而單鏈表不需要。
當元素小於8個當時候,此時做查詢操作,鏈表結構已經能保證查詢性能。當元素大於8個的時候,此時需要紅黑樹來加快查詢速度,但是新增節點的效率變慢了。
因此,如果一開始就用紅黑樹結構,元素太少,新增效率又比較慢,無疑這是浪費性能的。

我不用紅黑樹,用二叉查找樹可以麼

可以。但是二叉查找樹在特殊情況下會變成一條線性結構(這就跟原來使用鏈表結構一樣了,造成很深的問題),遍歷查找會非常慢。

當鏈表轉爲紅黑樹後,什麼時候退化爲鏈表

爲6的時候退轉爲鏈表。中間有個差值7可以防止鏈表和樹之間頻繁的轉換。假設一下,如果設計成鏈表個數超過8則鏈表轉換成樹結構,鏈表個數小於8則樹結構轉換成鏈表,如果一個HashMap不停的插入、刪除元素,鏈表個數在8左右徘徊,就會頻繁的發生樹轉鏈表、鏈表轉樹,效率會很低。

五、HashMap的併發問題

HashMap在併發編程環境下有什麼問題

  • 多線程擴容,引起的死循環問題
  • 多線程put的時候可能導致元素丟失
  • put非null元素後get出來的卻是null

在jdk1.8中還有這些問題麼

在jdk1.8中,死循環問題已經解決。其他兩個問題還是存在。
https://coolshell.cn/articles/9606.html

六、你一般用什麼作爲HashMap的key

健可以爲Null值麼

可以,key爲null的時候,hash算法最後的值以0來計算,也就是放在數組的第一個位置。
在這裏插入圖片描述

你一般用什麼作爲HashMap的key

一般用Integer、String這種不可變類當HashMap當key,而且String最爲常用。

  • 因爲字符串是不可變的,所以在它創建的時候hashcode就被緩存了,不需要重新計算。這就使得字符串很適合作爲Map中的鍵,字符串的處理速度要快過其它的鍵對象。這就是HashMap中的鍵往往都使用字符串。
  • 因爲獲取對象的時候要用到equals()和hashCode()方法,那麼鍵對象正確的重寫這兩個方法是非常重要的,這些類已經很規範的覆寫了hashCode()以及equals()方法。

我用可變類當HashMap的key有什麼問題

hashcode可能發生改變,導致put進去的值,無法get出。

如果讓你實現一個自定義的class作爲HashMap的key該如何實現

針對問題一,記住下面四個原則

  • 兩個對象相等,hashcode一定相等
  • 兩個對象不等,hashcode不一定不等
  • hashcode相等,兩個對象不一定相等
  • hashcode不等,兩個對象一定不等

如何寫一個不可變類

  • 類添加final修飾符,保證類不被繼承
  • 保證所有成員變量必須私有,並且加上final修飾
  • 不提供改變成員變量的方法,包括setter
  • 通過構造器初始化所有成員,進行深拷貝(deep copy)
    public final class MyImmutableDemo {  
        private final int[] myArray;  
        public MyImmutableDemo(int[] array) {  
            this.myArray = array.clone();   
        }   
    }
    
  • 在getter方法中,不要直接返回對象本身,而是克隆對象。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章