java 中幾種map的存儲原理和內存佔用情況

Map,即映射,也稱爲 鍵值對,有一個 Key, 一個 Value 。

比如 Groovy 語言中,  def  map = ['name' : 'liudehua', 'age' : 50 ] ,則 map[ 'name' ]  的值是 'liudehua'。 

那麼 Map 內部存儲是怎麼實現的呢?   下面慢慢講解.

一、 使用 拉鍊式存儲

這個以 Java 中的 HashMap 爲例進行講解。   HashMap 的內部有個數組 Entry[]  table, 這個數組就是存放數據的。 

Entry 類的定義大致是 :

class Entry {

Object  key

Object  value

Entry next;

}

所以, Entry[]  table  的每個元素都是一個鏈表,即 HashMap 的內部存儲是 數組 + 鏈表,即拉鍊式存儲。

當往 HaspMap 中 put(key,  value) 數據時,先進行  key.hashCode()  &  (table.length() - 1) ,得到一個小於 table.length() 的值, 稱爲 index, 則這個新的 Entry 就屬於 table[index] 這個鏈表了 ( 如果鏈表還不存在,則把這個新的 Entry 作爲鏈表的頭部了 );  然後開始從前往後遍歷  table[index] 這個鏈表,如果 key.equals( entry.key ), 那麼表示這個 key 已經有了舊值,則替換 value 的值即可;

否則,把這個新的 Entry 插入到 table[index] 鏈表的最前面.

以上就是 HashMap 的存儲方式介紹了, 而且可以知道,作爲 HashMap 的 Key, 它的 hashCode() 和 equals() 方法都被使用了

二、數組存儲

1.分散的數組存儲

這個以 ThreadLocal  和 ThreadLocal.Values  類爲例進行講解。 Values 類裏面有兩個變量, Object[]  table, 和 mask , table 就是存儲數據的數組了,table 的長度是 2 的倍數 ,  mask 的值就是  table.length - 1 ;  這一點和 HashMap 的內部存儲很像。  不過 table 中的每個元素就不是鏈表了。

當往  Values 中進行 put(key, value) 時,先進行 key.hashCode & mask ,得到一個小於 table.length 的值,稱爲 index (與上面的 HashMap 好像,哈哈), 然後去檢查 table[index] 的值,如果不存在,則在 table[index] 處放入 key, table[index + 1] 處放入 value; 如果已經存在了,且 key.equals( oldKey ) 不成立,即發生了衝突,那麼 index = index + 2 ( 此處是 + 2,因爲 key ,value 兩個是挨着放的,一個元素佔倆坑 ) ; 往下一地方找找,如果再衝突,再找,直到找到一個可插入的地方,把 table[index] = key, table[index + 1] = value;  

有兩處需要注意:

key.hashCode() 必須是 2 的倍數, 否則 index 的值有可能爲奇數,如此就可能發生衝突了.  可參考 ThreadLocal.hash 這個成員變量

table 內部的數據是分散着存儲的.


2.連續的數組存儲

這個以 Android 中新增的 ArrayMap 爲例進行分析( 據說沒 ArrayMap 是用來替換 HashMap 的哈 ),  ArrayMap 中有兩個主要變量, int[]  mHashes, Object[]  mArrays. 

mHashes 主要是存放 key 的 hash 值的, mArrays 是用來存放數據的,它也是奇數存放 key ,偶數存放 value , key 和 value 順序排列( 這個和 TheadLocal.value 中的 table 存儲方式很像 )。  mArrays 的長度是 mHashes 的 2 倍,畢竟 mArrays 是 key, value 都要存嘛~

mHashes 中存放 key 的 hash 值,是從小到大排列的,如果有多個 key 的 hash 值有一樣的,那麼就挨着排列

當往 ArrayMap 中進行 put(key, value) 時,先 int hash = key.hashCode, 然後通過二分查找在 mHashes 中查找 hash 的位置( 如果裏面有,就返回,如果無,就先找到最接近的位置,然後進行取反操作並返回 )  index,如果 index > 0 ,那麼再去 mArrays 中 2 * index 處獲取 key 值,比對兩個 key 是否 equals(), 如果不相等,那麼再分別向上、向下查找附近相同 hash 值的 key ,看是否有 equals() 的 key, 若有,則替換,若無,則插入;    如果 index < 0 ,表示之前沒有相等 hash 的 key 插入過,那麼 index = ~index( 再次取反,就是個正數了,代辦要插入的位置), 再在 mHashes 的 index 處插入 hash, 在 mArrays 的 2 * index 處插入 key, 在 (2 * index ) + 1 處,插入 value . 

注意:

mHashes 和 mArrays 在插入新數據時,都需要把插入位置後面的數據向後移動一個單位,這個對於頻繁插入、刪除的動作來說消耗比較大.

key 的 hash 大小決定了插入的順序


3.以數字爲 key 的數組存儲

這類的 map 比較特殊,key 是數字類型。  這個以 Android 中新增的 SparseArray 進行分析。 SparseArray 中有兩個主要變量, int[]  mKeys  和  Object[]  mValues , mKeys 是存放 key 的,是個有序數組,從小到大排列;  mValues 是與 mKeys 一一對應的 value 值集合.   mKeys 和 mValues 的長度是相等的。

當往  SparseArray 中 put(key, value) 時,先用二分查找在 mKeys 中查找 key 所在的位置 (如果找到,返回; 如果沒有找到,則找到它應該插入的位置,取反並返回) ,記爲 index, index > 0 ,則直接在 mValues[index] 處替換 value; 如果 index < 0 ,則 index = ~index, 即取反, 然後在 mKeys 的 index 處插入 key , 在 mValues[index] 處插入 value ,之前的數據自 index 處後移一個單位。

注意:

mKeys 和 mArrays 的數據插入時,都是要進行數據移動的,對頻繁插入、刪除的 map 來說消耗很大.


最後了,對它們的優缺點做些對比。

HashMap : 內存佔用較大,增、刪的效率較高,改、查的效率一般

ThreadLocal.Values :  內存佔用一般,當數據量比較小時,增刪改查的效率高;數據量大時,增刪改查效率一般

ArrayMap: 內存佔用較小,改、查的效率高,增、刪的效率較低

SparseArray : 內存佔用較小,改、查的效率高,增、刪的效率低,且主鍵是數字

發佈了2 篇原創文章 · 獲贊 1 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章