JDK1.8源碼(七)——java.util.HashMap 類

目錄

 


  本篇博客我們來介紹在 JDK1.8 中 HashMap 的源碼實現,這也是最常用的一個集合。但是在介紹 HashMap 之前,我們先介紹什麼是 Hash表。

回到頂部

1、哈希表

  Hash表也稱爲散列表,也有直接譯作哈希表,Hash表是一種根據關鍵字值(key - value)而直接進行訪問的數據結構。也就是說它通過把關鍵碼值映射到表中的一個位置來訪問記錄,以此來加快查找的速度。在鏈表、數組等數據結構中,查找某個關鍵字,通常要遍歷整個數據結構,也就是O(N)的時間級,但是對於哈希表來說,只是O(1)的時間級。

  比如對於前面我們講解的 ArrayList 集合和 LinkedList ,如果我們要查找這兩個集合中的某個元素,通常是通過遍歷整個集合,需要O(N)的時間級。

  

  如果是哈希表,它是通過把關鍵碼值映射到表中一個位置來訪問記錄,以加快查找的速度。這個映射函數叫做散列函數,存放記錄的數組叫做散列表,只需要O(1)的時間級。

  

  ①、存放在哈希表中的數據是key-value 鍵值對,比如存放哈希表的數據爲:

  {Key1-Value1,Key2-Value2,Key3-Value3,Key4-Value4,Key5-Value5,Key6-Value6}

  如果我們想查找是否存在鍵值對 Key3-Value3,首先通過 Key3 經過散列函數,得到值 k3,然後通過 k3 和散列表對應的值找到是 Value3。

  ②、當然也有可能存放哈希表的值只是 Value1,Value2,Value3這種類型:

  {Value1,Value2,Value3,Value4,Value5,Value6}

  這時候我們可以假設 Value1 是等於 Key1的,也就是{Value1-Value1,Value2-Value2,Value3-Value3,Value4-Value4,Value5-Value5,Value6-Value6}可以將 Value1經過散列函數轉換成與散列表對應的值。

大家都用過漢語字典吧,漢語字典的優點是我們可以通過前面的拼音目錄快速定位到所要查找的漢字。當給定我們某個漢字時,大腦會自動將漢字轉換成拼音(如果我們認識,不認識可以通過偏旁部首),這個轉換的過程我們可以看成是一個散列函數,之後在根據轉換得到的拼音找到該字所在的頁碼,從而找到該漢字。

   漢語字典是哈希表的典型實現,但是我們仔細思考,會發現這樣幾個問題?

  ①、爲什麼要有散列函數?

  ②、多個 key 通過散列函數會得到相同的值,這時候怎麼辦?

  對於第一個問題,散列函數的存在能夠幫助我們更快的確定key和value的映射關係,試想一下,如果沒有漢字和拼音的轉換規則(或者漢字和偏旁部首的),給你一個漢字,你該如何從字典中找到該漢字?我想除了遍歷整部字典,你沒有什麼更好的辦法。

  對於第二個問題,多個 key 通過散列函數得到相同的值,這其實也是哈希表最大的問題——衝突。比如同音字漢字,我們得到的拼音就會是相同的,那麼我們該如何在字典中存放同音字漢字呢?有兩種做法:

  第一種是開放地址法,當我們遇到衝突了,這時候通過另一種函數再計算一遍,得到相應的映射關係。比如對於漢語字典,一個字 “餘”,拼音是“yu”,我們將其放在頁碼爲567(假設在該位置),這時候又來了一個漢字“於”,拼音也是“yu”,那麼這時候我們要是按照轉換規則,也得將其放在頁碼爲567的位置,但是我們發現這個頁碼已經被佔用了,這時候怎麼辦?我們可以在通過另一種函數,得到的值加1。那麼漢字"於"就會被放在576+1=577的位置。

  第二種是鏈地址法,我們可以將字典的每一頁都看成是一個子數組或者子鏈表,當遇到衝突了,直接往當前頁碼的子數組或者子鏈表裏面填充即可。那麼我們進行同音字查找的時候,可能需要遍歷其子數組或者子鏈表。如下圖所示:

  

  對於開放地址法,可能會遇到二次衝突,三次衝突,所以需要良好的散列函數,分佈的越均勻越好。對於鏈地址法,雖然不會造成二次衝突,但是如果一次衝突很多,那麼會造成子數組或者子鏈表很長,那麼我們查找所需遍歷的時間也會很長。

  關於哈希表的詳細介紹,請點擊這裏

回到頂部

2、什麼是 HashMap?

  聽名字就知道,HashMap 是一個利用哈希表原理來存儲元素的集合。遇到衝突時,HashMap 是採用的鏈地址法來解決,在 JDK1.7 中,HashMap 是由 數組+鏈表構成的。但是在 JDK1.8 中,HashMap 是由 數組+鏈表+紅黑樹構成,新增了紅黑樹作爲底層數據結構,結構變得複雜了,但是效率也變的更高效。下面我們來具體介紹在 JDK1.8 中 HashMap 是如何實現的。

  

回到頂部

3、HashMap定義

  HashMap 是一個散列表,它存儲的內容是鍵值對(key-value)映射,而且 key 和 value 都可以爲 null。

1 public class HashMap<K,V> extends AbstractMap<K,V>
2     implements Map<K,V>, Cloneable, Serializable {

  

  首先該類實現了一個 Map 接口,該接口定義了一組鍵值對映射通用的操作。儲存一組成對的鍵-值對象,提供key(鍵)到value(值)的映射,Map中的key不要求有序,不允許重複。value同樣不要求有序,但可以重複。但是我們發現該接口方法有很多,我們設計某個鍵值對的集合有時候並不像實現那麼多方法,那該怎麼辦?

  JDK 還爲我們提供了一個抽象類 AbstractMap ,該抽象類繼承 Map 接口,所以如果我們不想實現所有的 Map 接口方法,就可以選擇繼承抽象類 AbstractMap 。

  但是我們發現 HashMap 類即繼承了 AbstractMap 接口,也實現了 Map 接口,這樣做難道不是多此一舉?後面我們會講的 LinkedHashSet 集合也有這樣的寫法。

  畢竟 JDK 經過這麼多年的發展維護,博主起初也是認爲這樣是有具體的作用的,後來找了很多資料,發現這其實完全沒有任何作用,具體出處

據 java 集合框架的創始人Josh Bloch描述,這樣的寫法是一個失誤。在java集合框架中,類似這樣的寫法很多,最開始寫java集合框架的時候,他認爲這樣寫,在某些地方可能是有價值的,直到他意識到錯了。顯然的,JDK的維護者,後來不認爲這個小小的失誤值得去修改,所以就這樣存在下來了。

  HashMap 集合還實現了 Cloneable 接口以及 Serializable 接口,分別用來進行對象克隆以及將對象進行序列化。

回到頂部

4、字段屬性

複製代碼

 1     //序列化和反序列化時,通過該字段進行版本一致性驗證
 2     private static final long serialVersionUID = 362498820763181265L;
 3     //默認 HashMap 集合初始容量爲16(必須是 2 的倍數)
 4     static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
 5     //集合的最大容量,如果通過帶參構造指定的最大容量超過此數,默認還是使用此數
 6     static final int MAXIMUM_CAPACITY = 1 << 30;
 7     //默認的填充因子
 8     static final float DEFAULT_LOAD_FACTOR = 0.75f;
 9     //當桶(bucket)上的結點數大於這個值時會轉成紅黑樹(JDK1.8新增)
10     static final int TREEIFY_THRESHOLD = 8;
11     //當桶(bucket)上的節點數小於這個值時會轉成鏈表(JDK1.8新增)
12     static final int UNTREEIFY_THRESHOLD = 6;
13     /**(JDK1.8新增)
14      * 當集合中的容量大於這個值時,表中的桶才能進行樹形化 ,否則桶內元素太多時會擴容,
15      * 而不是樹形化 爲了避免進行擴容、樹形化選擇的衝突,這個值不能小於 4 * TREEIFY_THRESHOLD
16      */
17     static final int MIN_TREEIFY_CAPACITY = 64;

複製代碼

  注意:後面三個字段是 JDK1.8 新增的,主要是用來進行紅黑樹和鏈表的互相轉換。

複製代碼

 1     /**
 2      * 初始化使用,長度總是 2的冪
 3      */
 4     transient Node<K,V>[] table;
 5 
 6     /**
 7      * 保存緩存的entrySet()
 8      */
 9     transient Set<Map.Entry<K,V>> entrySet;
10 
11     /**
12      * 此映射中包含的鍵值映射的數量。(集合存儲鍵值對的數量)
13      */
14     transient int size;
15 
16     /**
17      * 跟前面ArrayList和LinkedList集合中的字段modCount一樣,記錄集合被修改的次數
18      * 主要用於迭代器中的快速失敗
19      */
20     transient int modCount;
21 
22     /**
23      * 調整大小的下一個大小值(容量*加載因子)。capacity * load factor
24      */
25     int threshold;
26 
27     /**
28      * 散列表的加載因子。
29      */
30     final float loadFactor;

複製代碼

  下面我們重點介紹上面幾個字段:

  ①、Node<K,V>[] table

  我們說 HashMap 是由數組+鏈表+紅黑樹組成,這裏的數組就是 table 字段。後面對其進行初始化長度默認是 DEFAULT_INITIAL_CAPACITY= 16。而且 JDK 聲明數組的長度總是 2的n次方(一定是合數),爲什麼這裏要求是合數,一般我們知道哈希算法爲了避免衝突都要求長度是質數,這裏要求是合數,下面在介紹 HashMap 的hashCode() 方法(散列函數),我們再進行講解。

  ②、size

  集合中存放key-value 的實時對數。

  ③、loadFactor

  裝載因子,是用來衡量 HashMap 滿的程度,計算HashMap的實時裝載因子的方法爲:size/capacity,而不是佔用桶的數量去除以capacity。capacity 是桶的數量,也就是 table 的長度length。

  默認的負載因子0.75 是對空間和時間效率的一個平衡選擇,建議大家不要修改,除非在時間和空間比較特殊的情況下,如果內存空間很多而又對時間效率要求很高,可以降低負載因子loadFactor 的值;相反,如果內存空間緊張而對時間效率要求不高,可以增加負載因子 loadFactor 的值,這個值可以大於1。

  ④、threshold

  計算公式:capacity * loadFactor。這個值是當前已佔用數組長度的最大值。過這個數目就重新resize(擴容),擴容後的 HashMap 容量是之前容量的兩倍

回到頂部

5、構造函數

  ①、默認無參構造函數

複製代碼

    /**
     * 默認構造函數,初始化加載因子loadFactor = 0.75
     */
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; 
    }

複製代碼

  無參構造器,初始化散列表的加載因子爲0.75

  ②、指定初始容量的構造函數

複製代碼

 1     /**
 2      * 
 3      * @param initialCapacity 指定初始化容量
 4      * @param loadFactor 加載因子 0.75
 5      */
 6     public HashMap(int initialCapacity, float loadFactor) {
 7         //初始化容量不能小於 0 ,否則拋出異常
 8         if (initialCapacity < 0)
 9             throw new IllegalArgumentException("Illegal initial capacity: " +
10                                                initialCapacity);
11         //如果初始化容量大於2的30次方,則初始化容量都爲2的30次方
12         if (initialCapacity > MAXIMUM_CAPACITY)
13             initialCapacity = MAXIMUM_CAPACITY;
14         //如果加載因子小於0,或者加載因子是一個非數值,拋出異常
15         if (loadFactor <= 0 || Float.isNaN(loadFactor))
16             throw new IllegalArgumentException("Illegal load factor: " +
17                                                loadFactor);
18         this.loadFactor = loadFactor;
19         this.threshold = tableSizeFor(initialCapacity);
20     }
21     // 返回大於等於initialCapacity的最小的二次冪數值。
22     // >>> 操作符表示無符號右移,高位取0。
23     // | 按位或運算
24     static final int tableSizeFor(int cap) {
25         int n = cap - 1;
26         n |= n >>> 1;
27         n |= n >>> 2;
28         n |= n >>> 4;
29         n |= n >>> 8;
30         n |= n >>> 16;
31         return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
32     }

複製代碼

回到頂部

6、確定哈希桶數組索引位置

  前面我們講解哈希表的時候,我們知道是用散列函數來確定索引的位置。散列函數設計的越好,使得元素分佈的越均勻。HashMap 是數組+鏈表+紅黑樹的組合,我們希望在有限個數組位置時,儘量每個位置的元素只有一個,那麼當我們用散列函數求得索引位置的時候,我們能馬上知道對應位置的元素是不是我們想要的,而不是要進行鏈表的遍歷或者紅黑樹的遍歷,這會大大優化我們的查詢效率。我們看 HashMap 中的哈希算法:

複製代碼

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
    
    i = (table.length - 1) & hash;//這一步是在後面添加元素putVal()方法中進行位置的確定

複製代碼

  主要分爲三步:

  ①、取 hashCode 值: key.hashCode()

  ②、高位參與運算:h>>>16

  ③、取模運算:(n-1) & hash

  這裏獲取 hashCode() 方法的值是變量,但是我們知道,對於任意給定的對象,只要它的 hashCode() 返回值相同,那麼程序調用 hash(Object key) 所計算得到的 hash碼 值總是相同的。

  爲了讓數組元素分佈均勻,我們首先想到的是把獲得的 hash碼對數組長度取模運算( hash%length),但是計算機都是二進制進行操作,取模運算相對開銷還是很大的,那該如何優化呢?

  HashMap 使用的方法很巧妙,它通過 hash & (table.length -1)來得到該對象的保存位,前面說過 HashMap 底層數組的長度總是2的n次方,這是HashMap在速度上的優化。當 length 總是2的n次方時,hash & (length-1)運算等價於對 length 取模,也就是 hash%length,但是&比%具有更高的效率。比如 n % 32 = n & (32 -1)

  這也解釋了爲什麼要保證數組的長度總是2的n次方。

  再就是在 JDK1.8 中還有個高位參與運算,hashCode() 得到的是一個32位 int 類型的值,通過hashCode()的高16位 異或 低16位實現的:(h = k.hashCode()) ^ (h >>> 16),主要是從速度、功效、質量來考慮的,這麼做可以在數組table的length比較小的時候,也能保證考慮到高低Bit都參與到Hash的計算中,同時不會有太大的開銷。

  下面舉例說明下,n爲table的長度:

  

回到頂部

7、添加元素

複製代碼

 1     //hash(key)就是上面講的hash方法,對其進行了第一步和第二步處理
 2     public V put(K key, V value) {
 3         return putVal(hash(key), key, value, false, true);
 4     }
 5     /**
 6      * 
 7      * @param hash 索引的位置
 8      * @param key  鍵
 9      * @param value  值
10      * @param onlyIfAbsent true 表示不要更改現有值
11      * @param evict false表示table處於創建模式
12      * @return
13      */
14     final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
15             boolean evict) {
16          Node<K,V>[] tab; Node<K,V> p; int n, i;
17          //如果table爲null或者長度爲0,則進行初始化
18          //resize()方法本來是用於擴容,由於初始化沒有實際分配空間,這裏用該方法進行空間分配,後面會詳細講解該方法
19          if ((tab = table) == null || (n = tab.length) == 0)
20              n = (tab = resize()).length;
21          //注意:這裏用到了前面講解獲得key的hash碼的第三步,取模運算,下面的if-else分別是 tab[i] 爲null和不爲null
22          if ((p = tab[i = (n - 1) & hash]) == null)
23              tab[i] = newNode(hash, key, value, null);//tab[i] 爲null,直接將新的key-value插入到計算的索引i位置
24          else {//tab[i] 不爲null,表示該位置已經有值了
25              Node<K,V> e; K k;
26              if (p.hash == hash &&
27                  ((k = p.key) == key || (key != null && key.equals(k))))
28                  e = p;//節點key已經有值了,直接用新值覆蓋
29              //該鏈是紅黑樹
30              else if (p instanceof TreeNode)
31                  e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
32              //該鏈是鏈表
33              else {
34                  for (int binCount = 0; ; ++binCount) {
35                      if ((e = p.next) == null) {
36                          p.next = newNode(hash, key, value, null);
37                          //鏈表長度大於8,轉換成紅黑樹
38                          if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
39                              treeifyBin(tab, hash);
40                          break;
41                      }
42                      //key已經存在直接覆蓋value
43                      if (e.hash == hash &&
44                          ((k = e.key) == key || (key != null && key.equals(k))))
45                          break;
46                      p = e;
47                  }
48              }
49              if (e != null) { // existing mapping for key
50                  V oldValue = e.value;
51                  if (!onlyIfAbsent || oldValue == null)
52                      e.value = value;
53                  afterNodeAccess(e);
54                  return oldValue;
55              }
56          }
57          ++modCount;//用作修改和新增快速失敗
58          if (++size > threshold)//超過最大容量,進行擴容
59              resize();
60          afterNodeInsertion(evict);
61          return null;
62     }

複製代碼

  ①、判斷鍵值對數組 table 是否爲空或爲null,否則執行resize()進行擴容;

  ②、根據鍵值key計算hash值得到插入的數組索引i,如果table[i]==null,直接新建節點添加,轉向⑥,如果table[i]不爲空,轉向③;

  ③、判斷table[i]的首個元素是否和key一樣,如果相同直接覆蓋value,否則轉向④,這裏的相同指的是hashCode以及equals;

  ④、判斷table[i] 是否爲treeNode,即table[i] 是否是紅黑樹,如果是紅黑樹,則直接在樹中插入鍵值對,否則轉向⑤;

  ⑤、遍歷table[i],判斷鏈表長度是否大於8,大於8的話把鏈表轉換爲紅黑樹,在紅黑樹中執行插入操作,否則進行鏈表的插入操作;遍歷過程中若發現key已經存在直接覆蓋value即可;

  ⑥、插入成功後,判斷實際存在的鍵值對數量size是否超過了最大容量threshold,如果超過,進行擴容。

  ⑦、如果新插入的key不存在,則返回null,如果新插入的key存在,則返回原key對應的value值(注意新插入的value會覆蓋原value值)

  注意1:看第 58,59 行代碼:

if (++size > threshold)//超過最大容量,進行擴容
    resize();

  這裏有個考點,我們知道 HashMap 是由數組+鏈表+紅黑樹(JDK1.8)組成,如果在添加元素時,發生衝突,會將衝突的數放在鏈表上,當鏈表長度超過8時,會自動轉換成紅黑樹。

  那麼有如下問題:數組上有5個元素,而某個鏈表上有3個元素,問此HashMap的 size 是多大?

  我們分析第58,59 行代碼,很容易知道,只要是調用put() 方法添加元素,那麼就會調用 ++size(這裏有個例外是插入重複key的鍵值對,不會調用,但是重複key元素不會影響size),所以,上面的答案是 7。

  注意2:看第 53 、 60 行代碼:

 afterNodeAccess(e);
 afterNodeInsertion(evict);

  這裏調用的該方法,其實是調用瞭如下實現方法:

void afterNodeAccess(Node<K,V> p) { }
void afterNodeInsertion(boolean evict) { }

  這都是一個空的方法實現,我們在這裏可以不用管,但是在後面介紹 LinkedHashMap 會用到,LinkedHashMap 是繼承的 HashMap,並且重寫了該方法,後面我們會詳細介紹。

回到頂部

8、擴容機制

  擴容(resize),我們知道集合是由數組+鏈表+紅黑樹構成,向 HashMap 中插入元素時,如果HashMap 集合的元素已經大於了最大承載容量threshold(capacity * loadFactor),這裏的threshold不是數組的最大長度。那麼必須擴大數組的長度,Java中數組是無法自動擴容的,我們採用的方法是用一個更大的數組代替這個小的數組,就好比以前是用小桶裝水,現在小桶裝不下了,我們使用一個更大的桶。

  JDK1.8融入了紅黑樹的機制,比較複雜,這裏我們先介紹 JDK1.7的擴容源碼,便於理解,然後在介紹JDK1.8的源碼。

複製代碼

 1     //參數 newCapacity 爲新數組的大小
 2     void resize(int newCapacity) {
 3         Entry[] oldTable = table;//引用擴容前的 Entry 數組
 4         int oldCapacity = oldTable.length;
 5         if (oldCapacity == MAXIMUM_CAPACITY) {//擴容前的數組大小如果已經達到最大(2^30)了
 6             threshold = Integer.MAX_VALUE;///修改閾值爲int的最大值(2^31-1),這樣以後就不會擴容了
 7             return;
 8         }
 9 
10         Entry[] newTable = new Entry[newCapacity];//初始化一個新的Entry數組
11         transfer(newTable, initHashSeedAsNeeded(newCapacity));//將數組元素轉移到新數組裏面
12         table = newTable;
13         threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);//修改閾值
14     }
15     void transfer(Entry[] newTable, boolean rehash) {
16         int newCapacity = newTable.length;
17         for (Entry<K,V> e : table) {//遍歷數組
18             while(null != e) {
19                 Entry<K,V> next = e.next;
20                 if (rehash) {
21                     e.hash = null == e.key ? 0 : hash(e.key);
22                 }
23                 int i = indexFor(e.hash, newCapacity);//重新計算每個元素在數組中的索引位置
24                 e.next = newTable[i];//標記下一個元素,添加是鏈表頭添加
25                 newTable[i] = e;//將元素放在鏈上
26                 e = next;//訪問下一個 Entry 鏈上的元素
27             }
28         }
29     }

複製代碼

  通過方法我們可以看到,JDK1.7中首先是創建一個新的大容量數組,然後依次重新計算原集合所有元素的索引,然後重新賦值。如果數組某個位置發生了hash衝突,使用的是單鏈表的頭插入方法,同一位置的新元素總是放在鏈表的頭部,這樣與原集合鏈表對比,擴容之後的可能就是倒序的鏈表了。

  下面我們在看看JDK1.8的。

複製代碼

 1     final Node<K,V>[] resize() {
 2         Node<K,V>[] oldTab = table;
 3         int oldCap = (oldTab == null) ? 0 : oldTab.length;//原數組如果爲null,則長度賦值0
 4         int oldThr = threshold;
 5         int newCap, newThr = 0;
 6         if (oldCap > 0) {//如果原數組長度大於0
 7             if (oldCap >= MAXIMUM_CAPACITY) {//數組大小如果已經大於等於最大值(2^30)
 8                 threshold = Integer.MAX_VALUE;//修改閾值爲int的最大值(2^31-1),這樣以後就不會擴容了
 9                 return oldTab;
10             }
11             //原數組長度大於等於初始化長度16,並且原數組長度擴大1倍也小於2^30次方
12             else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
13                      oldCap >= DEFAULT_INITIAL_CAPACITY)
14                 newThr = oldThr << 1; // 閥值擴大1倍
15         }
16         else if (oldThr > 0) //舊閥值大於0,則將新容量直接等於就閥值 
17             newCap = oldThr;
18         else {//閥值等於0,oldCap也等於0(集合未進行初始化)
19             newCap = DEFAULT_INITIAL_CAPACITY;//數組長度初始化爲16
20             newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//閥值等於16*0.75=12
21         }
22         //計算新的閥值上限
23         if (newThr == 0) {
24             float ft = (float)newCap * loadFactor;
25             newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
26                       (int)ft : Integer.MAX_VALUE);
27         }
28         threshold = newThr;
29         @SuppressWarnings({"rawtypes","unchecked"})
30             Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
31         table = newTab;
32         if (oldTab != null) {
33             //把每個bucket都移動到新的buckets中
34             for (int j = 0; j < oldCap; ++j) {
35                 Node<K,V> e;
36                 if ((e = oldTab[j]) != null) {
37                     oldTab[j] = null;//元數據j位置置爲null,便於垃圾回收
38                     if (e.next == null)//數組沒有下一個引用(不是鏈表)
39                         newTab[e.hash & (newCap - 1)] = e;
40                     else if (e instanceof TreeNode)//紅黑樹
41                         ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
42                     else { // preserve order
43                         Node<K,V> loHead = null, loTail = null;
44                         Node<K,V> hiHead = null, hiTail = null;
45                         Node<K,V> next;
46                         do {
47                             next = e.next;
48                             //原索引
49                             if ((e.hash & oldCap) == 0) {
50                                 if (loTail == null)
51                                     loHead = e;
52                                 else
53                                     loTail.next = e;
54                                 loTail = e;
55                             }
56                             //原索引+oldCap
57                             else {
58                                 if (hiTail == null)
59                                     hiHead = e;
60                                 else
61                                     hiTail.next = e;
62                                 hiTail = e;
63                             }
64                         } while ((e = next) != null);
65                         //原索引放到bucket裏
66                         if (loTail != null) {
67                             loTail.next = null;
68                             newTab[j] = loHead;
69                         }
70                         //原索引+oldCap放到bucket裏
71                         if (hiTail != null) {
72                             hiTail.next = null;
73                             newTab[j + oldCap] = hiHead;
74                         }
75                     }
76                 }
77             }
78         }
79         return newTab;
80     }

複製代碼

  該方法分爲兩部分,首先是計算新桶數組的容量 newCap 和新閾值 newThr,然後將原集合的元素重新映射到新集合中。

  

  相比於JDK1.7,1.8使用的是2次冪的擴展(指長度擴爲原來2倍),所以,元素的位置要麼是在原位置,要麼是在原位置再移動2次冪的位置。我們在擴充HashMap的時候,不需要像JDK1.7的實現那樣重新計算hash,只需要看看原來的hash值新增的那個bit是1還是0就好了,是0的話索引沒變,是1的話索引變成“原索引+oldCap”。

回到頂部

9、刪除元素

  HashMap 刪除元素首先是要找到 桶的位置,然後如果是鏈表,則進行鏈表遍歷,找到需要刪除的元素後,進行刪除;如果是紅黑樹,也是進行樹的遍歷,找到元素刪除後,進行平衡調節,注意,當紅黑樹的節點數小於 6 時,會轉化成鏈表。

複製代碼

 1     public V remove(Object key) {
 2         Node<K,V> e;
 3         return (e = removeNode(hash(key), key, null, false, true)) == null ?
 4             null : e.value;
 5     }
 6     
 7     final Node<K,V> removeNode(int hash, Object key, Object value,
 8             boolean matchValue, boolean movable) {
 9         Node<K,V>[] tab; Node<K,V> p; int n, index;
10         //(n - 1) & hash找到桶的位置
11         if ((tab = table) != null && (n = tab.length) > 0 &&
12         (p = tab[index = (n - 1) & hash]) != null) {
13         Node<K,V> node = null, e; K k; V v;
14         //如果鍵的值與鏈表第一個節點相等,則將 node 指向該節點
15         if (p.hash == hash &&
16         ((k = p.key) == key || (key != null && key.equals(k))))
17         node = p;
18         //如果桶節點存在下一個節點
19         else if ((e = p.next) != null) {
20             //節點爲紅黑樹
21         if (p instanceof TreeNode)
22          node = ((TreeNode<K,V>)p).getTreeNode(hash, key);//找到需要刪除的紅黑樹節點
23         else {
24          do {//遍歷鏈表,找到待刪除的節點
25              if (e.hash == hash &&
26                  ((k = e.key) == key ||
27                   (key != null && key.equals(k)))) {
28                  node = e;
29                  break;
30              }
31              p = e;
32          } while ((e = e.next) != null);
33         }
34         }
35         //刪除節點,並進行調節紅黑樹平衡
36         if (node != null && (!matchValue || (v = node.value) == value ||
37                       (value != null && value.equals(v)))) {
38         if (node instanceof TreeNode)
39          ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
40         else if (node == p)
41          tab[index] = node.next;
42         else
43          p.next = node.next;
44         ++modCount;
45         --size;
46         afterNodeRemoval(node);
47         return node;
48         }
49         }
50         return null;
51     }

複製代碼

  注意第 46 行代碼

afterNodeRemoval(node);

  這也是爲實現 LinkedHashMap 做準備的,在這裏和上面一樣,是一個空方法實現,可以不用管。而在 LinkedHashMap 中進行了重寫,用來維護刪除節點後,鏈表的前後關係。

回到頂部

10、查找元素

  ①、通過 key 查找 value

  首先通過 key 找到計算索引,找到桶位置,先檢查第一個節點,如果是則返回,如果不是,則遍歷其後面的鏈表或者紅黑樹。其餘情況全部返回 null。

複製代碼

 1     public V get(Object key) {
 2         Node<K,V> e;
 3         return (e = getNode(hash(key), key)) == null ? null : e.value;
 4     }
 5     
 6     final Node<K,V> getNode(int hash, Object key) {
 7         Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
 8         if ((tab = table) != null && (n = tab.length) > 0 &&
 9             (first = tab[(n - 1) & hash]) != null) {
10             //根據key計算的索引檢查第一個索引
11             if (first.hash == hash && // always check first node
12                 ((k = first.key) == key || (key != null && key.equals(k))))
13                 return first;
14             //不是第一個節點
15             if ((e = first.next) != null) {
16                 if (first instanceof TreeNode)//遍歷樹查找元素
17                     return ((TreeNode<K,V>)first).getTreeNode(hash, key);
18                 do {
19                     //遍歷鏈表查找元素
20                     if (e.hash == hash &&
21                         ((k = e.key) == key || (key != null && key.equals(k))))
22                         return e;
23                 } while ((e = e.next) != null);
24             }
25         }
26         return null;
27     }

複製代碼

  ②、判斷是否存在給定的 key 或者 value

複製代碼

 1     public boolean containsKey(Object key) {
 2         return getNode(hash(key), key) != null;
 3     }
 4     public boolean containsValue(Object value) {
 5         Node<K,V>[] tab; V v;
 6         if ((tab = table) != null && size > 0) {
 7             //遍歷桶
 8             for (int i = 0; i < tab.length; ++i) {
 9                 //遍歷桶中的每個節點元素
10                 for (Node<K,V> e = tab[i]; e != null; e = e.next) {
11                     if ((v = e.value) == value ||
12                         (value != null && value.equals(v)))
13                         return true;
14                 }
15             }
16         }
17         return false;
18     }

複製代碼

回到頂部

11、遍歷元素

 首先構造一個 HashMap 集合:

1 HashMap<String,Object> map = new HashMap<>();
2 map.put("A","1");
3 map.put("B","2");
4 map.put("C","3");

  ①、分別獲取 key 集合和 value 集合。

複製代碼

1 //1、分別獲取key和value的集合
2 for(String key : map.keySet()){
3     System.out.println(key);
4 }
5 for(Object value : map.values()){
6     System.out.println(value);
7 }

複製代碼

  ②、獲取 key 集合,然後遍歷key集合,根據key分別得到相應value

1 //2、獲取key集合,然後遍歷key,根據key得到 value
2 Set<String> keySet = map.keySet();
3 for(String str : keySet){
4     System.out.println(str+"-"+map.get(str));
5 }

  ③、得到 Entry 集合,然後遍歷 Entry

1 //3、得到 Entry 集合,然後遍歷 Entry
2 Set<Map.Entry<String,Object>> entrySet = map.entrySet();
3 for(Map.Entry<String,Object> entry : entrySet){
4     System.out.println(entry.getKey()+"-"+entry.getValue());
5 }

  ④、迭代

複製代碼

1 //4、迭代
2 Iterator<Map.Entry<String,Object>> iterator = map.entrySet().iterator();
3 while(iterator.hasNext()){
4     Map.Entry<String,Object> mapEntry = iterator.next();
5     System.out.println(mapEntry.getKey()+"-"+mapEntry.getValue());
6 }

複製代碼

  基本上使用第三種方法是性能最好的,

  第一種遍歷方法在我們只需要 key 集合或者只需要 value 集合時使用;

  第二種方法效率很低,不推薦使用;

  第四種方法效率也挺好,關鍵是在遍歷的過程中我們可以對集合中的元素進行刪除。

回到頂部

12、總結

  ①、基於JDK1.8的HashMap是由數組+鏈表+紅黑樹組成,當鏈表長度超過 8 時會自動轉換成紅黑樹,當紅黑樹節點個數小於 6 時,又會轉化成鏈表。相對於早期版本的 JDK HashMap 實現,新增了紅黑樹作爲底層數據結構,在數據量較大且哈希碰撞較多時,能夠極大的增加檢索的效率。

  ②、允許 key 和 value 都爲 null。key 重複會被覆蓋,value 允許重複。

  ③、非線程安全

  ④、無序(遍歷HashMap得到元素的順序不是按照插入的順序)

 

參考文檔:https://docs.oracle.com/javase/8/docs/api/java/util/HashMap.html#

     http://www.importnew.com/20386.html

     https://www.cnblogs.com/nullllun/p/8327664.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章