BAT面試必備——Java 集合類

本文首發於我的個人博客:尾尾部落

來源:<a href=http://www.runoob.com/java/java-collections.html” title=”” />

來源:<a href=https://www.cnblogs.com/jing99/p/7057245.html” title=”” />

1. Iterator接口

Iterator接口,這是一個用於遍歷集合中元素的接口,主要包含hashNext(),next(),remove()三種方法。它的一個子接口LinkedIterator在它的基礎上又添加了三種方法,分別是add(),previous(),hasPrevious()。也就是說如果是先Iterator接口,那麼在遍歷集合中元素的時候,只能往後遍歷,被遍歷後的元素不會在遍歷到,通常無序集合實現的都是這個接口,比如HashSet,HashMap;而那些元素有序的集合,實現的一般都是LinkedIterator接口,實現這個接口的集合可以雙向遍歷,既可以通過next()訪問下一個元素,又可以通過previous()訪問前一個元素,比如ArrayList。

2. List

List是元素有序並且可以重複的集合。
List的主要實現:ArrayList, LinkedList, Vector。

2. ArrayList、LinkedList、Vector 的區別

ArrayList LinkedList Vector
底層實現 數組 雙向循環鏈表
同步性及效率 不同步,非線程安全,效率高 不同步,非線程安全,效率高
特點 查詢快,增刪慢 查詢慢,增刪快
默認容量 10 /
擴容機制 int newCapacity = oldCapacity + (oldCapacity >> 1); //1.5 倍 /

總結
- ArrayList 和 Vector 基於數組實現,對於隨機訪問get和set,ArrayList優於LinkedList,因爲LinkedList要移動指針。
- LinkedList 不會出現擴容的問題,所以比較適合隨機位置增、刪。但是其基於鏈表實現,所以在定位時需要線性掃描,效率比較低。
- 當操作是在一列數據的後面添加數據而不是在前面或中間,並且需要隨機地訪問其中的元素時,使用ArrayList會提供比較好的性能;
- 當你的操作是在一列數據的前面或中間添加或刪除數據,並且按照順序訪問其中的元素時,就應該使用LinkedList了。

3. Set

Set集合中的對象不按特定的方式排序(存入和取出的順序不一定一致),並且沒有重複對象。
Set的主要實現類:HashSet, TreeSet。

HashSet TreeSet LinkedHashSet
底層實現 HashMap 紅黑樹
重複性 不允許重複 不允許重複
有/無序 無序 有序,支持兩種排序方式,自然排序和定製排序,其中自然排序爲默認的排序方式。
時間複雜度 add(),remove(),contains()方法的時間複雜度是O(1) add(),remove(),contains()方法的時間複雜度是O(logn)
同步性 不同步,線程不安全 不同步,線程不安全
null值 允許null值 不支持null值,會拋出 java.lang.NullPointerException 異常。因爲TreeSet應用 compareTo() 方法於各個元素來比較他們,當比較null值時會拋出 NullPointerException異常。
比較 equals() compareTo()

HashSet如何檢查重複

當你把對象加入HashSet時,HashSet會先計算對象的hashcode值來判斷對象加入的位置,同時也會與其他加入的對象的hashcode值作比較,如果沒有相符的hashcode,HashSet會假設對象沒有重複出現。但是如果發現有相同hashcode值的對象,這時會調用equals()方法來檢查hashcode相等的對象是否真的相同。如果兩者相同,HashSet就不會讓加入操作成功。
hashCode()與equals()的相關規定:

  • 如果兩個對象相等,則hashcode一定也是相同的
  • 兩個對象相等,對兩個equals方法返回true
  • 兩個對象有相同的hashcode值,它們也不一定是相等的
  • 綜上,equals方法被覆蓋過,則hashCode方法也必須被覆蓋
    hashCode()的默認行爲是對堆上的對象產生獨特值。如果沒有重寫hashCode(),則該class的兩個對象無論如何都不會相等(即使這兩個對象指向相同的數據)。

總結:
HashSet是一個通用功能的Set,而LinkedHashSet 提供元素插入順序保證,TreeSet是一個SortedSet實現,由Comparator 或者 Comparable指定的元素順序存儲元素。

4. Map

Map 是一種把鍵對象和值對象映射的集合,它的每一個元素都包含一對鍵對象和值對象。 Map沒有繼承於Collection接口從Map集合中檢索元素時,只要給出鍵對象,就會返回對應的值對象。
Map 的常用實現類:HashMap、TreeMap、HashTable、LinkedHashMap、ConcurrentHashMap

HashMap HashTable
底層實現 數組+鏈表
同步性 線程不同步
null值 允許 key 和 Vale 是 null,但是隻允許一個 key 爲 null,且這個元素存放在哈希表 0 角標位置
hash 使用hash(Object key)擾動函數對 key 的 hashCode 進行擾動後作爲 hash 值
容量 容量爲 2^4 且容量一定是 2^n
擴容 兩倍,且哈希桶的下標使用 &運算代替了取模

幾個問題:

1. HashMap 的工作原理?
通過hash的方法,通過put和get存儲和獲取對象。存儲對象時,我們將K/V傳給put方法時,它調用hashCode計算hash從而得到bucket位置,進一步存儲,HashMap會根據當前bucket的佔用情況自動調整容量(超過Load Facotr則resize爲原來的2倍)。獲取對象時,我們將K傳給get,它調用hashCode計算hash從而得到bucket位置,並進一步調用equals()方法確定鍵值對。如果發生碰撞的時候,Hashmap通過鏈表將產生碰撞衝突的元素組織起來,在Java 8中,如果一個bucket中碰撞衝突的元素超過某個限制(默認是8),則使用紅黑樹來替換鏈表,從而提高效率。
2.get和put的原理嗎?equals()和hashCode()的都有什麼作用?
通過對key的hashCode()進行hashing,並計算下標( n-1 & hash),從而獲得buckets的位置。如果產生碰撞,則利用key.equals()方法去鏈表或樹中去查找對應的節點
3. HashMap 的長度爲什麼是2的冪次方?
爲了能讓 HashMap 存取高效,儘量較少碰撞,也就是要儘量把數據分配均勻,每個鏈表/紅黑樹長度大致相同。這個實現就是把數據存到哪個鏈表/紅黑樹中的算法。

HashMap 和 LinkedHashMap 的區別

  • LinkedHashMap 擁有與 HashMap 相同的底層哈希表結構,即數組 + 單鏈表 + 紅黑樹,也擁有相同的擴容機制。
  • LinkedHashMap 相比 HashMap 的拉鍊式存儲結構,內部額外通過 Entry 維護了一個雙向鏈表。
  • HashMap 元素的遍歷順序不一定與元素的插入順序相同,而 LinkedHashMap 則通過遍歷雙向鏈表來獲取元素,所以遍歷順序在一定條件下等於插入順序。
  • LinkedHashMap 可以通過構造參數 accessOrder 來指定雙向鏈表是否在元素被訪問後改變其在雙向鏈表中的位置。

HashMap & TreeMap 的區別

HashMap實現了Map接口,不保障元素順序。
TreeMap實現了SortedMap接口,是一個有序的Map。內部採用紅黑樹實現,紅黑樹是一種維護有序數據的高效數據結構

ConcurrentHashMap 和 Hashtable 的區別

ConcurrentHashMap 和 Hashtable 的區別主要體現在實現線程安全的方式上不同。
底層數據結構: JDK1.7的 ConcurrentHashMap 底層採用 分段的數組+鏈表 實現,JDK1.8 採用的數據結構跟HashMap1.8的結構一樣,數組+鏈表/紅黑二叉樹。Hashtable 和 JDK1.8 之前的 HashMap 的底層數據結構類似都是採用 數組+鏈表 的形式,數組是 HashMap 的主體,鏈表則是主要爲了解決哈希衝突而存在的;
實現線程安全的方式(重要): ① 在JDK1.7的時候,ConcurrentHashMap(分段鎖) 對整個桶數組進行了分割分段(Segment),每一把鎖只鎖容器其中一部分數據,多線程訪問容器裏不同數據段的數據,就不會存在鎖競爭,提高併發訪問率。(默認分配16個Segment,比Hashtable效率提高16倍。) 到了 JDK1.8 的時候已經摒棄了Segment的概念,而是直接用 Node 數組+鏈表+紅黑樹的數據結構來實現,併發控制使用 synchronized 和 CAS 來操作。(JDK1.6以後 對 synchronized鎖做了很多優化) 整個看起來就像是優化過且線程安全的 HashMap,雖然在JDK1.8中還能看到 Segment 的數據結構,但是已經簡化了屬性,只是爲了兼容舊版本;② Hashtable(同一把鎖) :使用 synchronized 來保證線程安全,效率非常低下。當一個線程訪問同步方法時,其他線程也訪問同步方法,可能會進入阻塞或輪詢狀態,如使用 put 添加元素,另一個線程不能使用 put 添加元素,也不能使用 get,競爭會越來越激烈效率越低。

JDK1.7的ConcurrentHashMap:

JDK1.8的ConcurrentHashMap(TreeBin: 紅黑二叉樹節點 Node: 鏈表節點):

參考

獲取最新資訊,請關注微信公衆號:南強說晚安

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章