前言
HashMap是Java中常用的集合,而且HashMap的一些思想,對於我們平時解決業務上的一些問題,在思路上有幫助,基於此,本篇博客將分析HashMap底層設計思想,並手寫一個迷你版的HashMap!
對HashMap的思考
第一,如圖所示,HashMap有3個要素:hash函數+數組+單鏈表
第二,對於hash函數而言,需要考慮些什麼?
要快,對於給定的Key,要能夠快速計算出在數組中的index。那麼什麼運算夠快呢?顯然是位運算!
要均勻分佈,要較少碰撞。說白了,我們希望通過hash函數,讓數據均勻分佈在數組中,不希望大量數據發生碰撞,導致鏈表過長。那麼怎麼辦到呢?也是利用位運算,通過對數據的二進制的位進行移動,讓hash函數得到的數據散列開來,從而減低了碰撞的概率。
如果發生了碰撞怎麼辦?上面的圖其實已經說明了JDK的HashMap是如何處理hash衝突的,就是通過單鏈表解決的。那麼除了這個方法,還有其他思路麼?比如說,如果發生衝突,那麼記下這個衝突的位置爲index,然後在加上固定步長,即index+step,找到這個位置,看一下是否仍然衝突,如果繼續衝突,那麼按照這個思路,繼續加上固定步長。其實這就是所謂的線性探測來解決Hash衝突的方法!
通過寫一個迷你版的HashMap來深刻理解
定義接口
定義一個接口,對外暴露快速存取的方法。
注意MyMap接口內部定義了一個內部接口Entry。
接口實現
HashMap的要素之一,就是數組,自然在這裏,我們要定義數組,數組的初始化大小,還要考慮擴容的閥值。
看MyHashMap的構造
構造方法有什麼好說的呢?
仔細觀察下,你會發現,其實這裏使用到了“門面模式”。這裏的2個構造方法其實指向的是同一個,但是對外卻暴露了2個“門面”!
Entry
HashMap的要素之一,單鏈表的體現就在這裏!
看put如何實現
第一,要考慮是否擴容?
HashMap中的Entry的數量(數組以及單鏈表中的所有Entry)是否達到閥值?
第二,如果擴容,意味着新生成一個Entry[],不僅如此還得重新散列。
第三,要根據Key計算出在Entry[]中的位置,定位後,如果Entry[]中的元素爲null,那麼可以放入其中,如果不爲空,那麼得遍歷單鏈表,要麼更新value,要麼形成一個新的Entry“擠壓”單鏈表!
hash函數
我這裏參考了JDK的HashMap的hash函數的實現,這裏也再次說明了:要想散列均勻,就得進行二進制的位運算!
resize和rehash
這裏可以看出,對於HashMap而言,如果頻繁進行resize/rehash操作,是會影響性能的。
resize/rehash的過程,就是數組變大,原來數組中的entry元素一個個的put到新數組的過程,需要注意的是一些狀態變量的改變。
get實現
get很簡單,只需要注意在遍歷單鏈表的過程中使用== or equals來判斷下即可。
Test測試
運行結果
OK,一個迷你版的HashMap就寫好了,你學到了麼?