Java Collection API提供了一些列的類和接口來幫助我們存儲和管理對象集合。其實Java中的集合工作起來像是一個數組,不過集合的大小是可以動態改變的,而且集合也提供了更多高級功能。有了JavaCollectionAPI,我們就不需要自己編寫集合類了,大部分Java集合類都位於java.util
包裏面,還有一些和併發相關的集合類位於java.util.concurrent
包中。下面就介紹一下Java API 爲我們提供的這些集合類。
一、Java 集合概覽
Java中的集合有兩大類,分別是:
1. Collection
2. Map
Collection類的集合可以理解爲主要存放的是單個對象,而Map類的集合主要存儲的是key-value類型的對象。這兩大類即可理所當然的對應着兩個接口,分別是Collection接口
和Map接口
,下面這幅圖列出了這兩個接口的繼承樹:
從上面這幅圖可以看到,Collection接口又衍生了出三個分支,分別是:
1. List
2. Set
3. Queue
而Map則相對簡單,只有一個分支。下面我們就詳細介紹Java Collection的每一個實現類。
注意:要把Collection、Collections區分開,Collection是集合的一個接口,而Collections是一個工具類,它提供了一些靜態方法來方便我們操作集合的實例,這兩個都位於java.util
包中。
二、先從Collection接口介紹
下圖是Collection接口的源碼截圖,從接口中的抽象方法我們可以看出,它定義了一個通用集合常用的方法:
- 增加刪除一個元素
- 判斷元素是否存在
- 獲得集合的大小
- 迭代一個集合
2.1 Collection的List接口
List接口繼承自Collection接口,它的特點是其中的對象是有序的,並且每個對象都有一個唯一的index,我們可以通過這個index來搜索某個元素,並且List中的對象允許重複,這類似於一個數組。對於List接口,Java API提供瞭如下實現:
- java.util.ArrayList
- java.util.LinkedList
- java.util.Vector
- java.util.Stack
當然,在 java.util.concurrent
包中也有一些實現,這些內容會在另一篇文章中詳細介紹。
ArrayList是最常用的集合,其內部實現是一個數組,ArrayList的大小是可以動態擴充的。對於元素的隨機訪問效率高,其訪問的時間複雜度爲O(1)
,對於數據的插入與刪除,從尾部操作效率高,時間複雜度和隨機訪問一樣是O(1)
,若是從頭部操作則效率會比較低,因爲從頭部插入或刪除時需要移動後面所有元素,其時間複雜度爲O(n-i)
(n表示元素個數,i表示元素位置)。
LinkList:從上圖可以看出,不但繼承了List
接口,還繼承了Deque
接口(後面會介紹)。LinkList是一個基於鏈表的數據結構,每個節點都保存了上一個和下一個節點的指針。LinkList對於隨機訪問效率是比較低的,因爲它需要從頭開始索引,所以其時間複雜度爲O(i)
。但是對於元素的增刪,LinkList效率高,因爲只需要修改前後指針即可,其時間複雜度爲O(1)
。
Vector:從Vector和ArrayList源碼截圖可以看出,它們繼承的接口完全一致。所以,Vector可以看做是一個線程安全的ArrayList,它內部也是基於數組實現的,不過幾乎所有的集合操作都加了synchronized
關鍵字。
Stack:上面是Stack類源碼截圖,我們看到Stack類其實繼承自Vector,Stack只是在Vector的基礎上添加了幾個方法以提供棧(Last In First Out LIFO)的特性。Stack的特點是添加時新元素會被添加到頂部,移除時頂部的元素最先被移除。這種數據結構主要用作一些特殊數據加工流程,如語言編譯、XML解析等。
2.2 Collection的Set接口
Set和List接口一樣也是繼承自Collection
接口,同樣是對集合的一種實現,它們之間最大的區別是Set中的對象不允許重複。對於Set
接口,Java API提供瞭如下實現:
- java.util.EnumSet
- java.util.HashSet
- java.util.LinkedHashSet
- java.util.TreeSet
這些類的功能稍有不同,區別主要體現在對象的迭代的順序及插入、查找的效率上。
HashSet的實現很簡單,其內部就是一個HashMap
,不過它對元素的順序沒有保證。
LinkedHashSet的實現也很簡單,其內部用的是一個LinkedHashMap
。因爲LinkedHashMap
內部維護了一個雙向鏈表以保持順序,所以LinkedHashSet
的特點是它當中的元素是有序的,元素迭代的順序就是其插入的順序,元素的再次插入不會影響原有元素的順序。
TreeSet:從上圖的繼承關係可以看出,想要了解TreeSet
就要先了解NavigableSet
和SortedSet
接口。
SortedSet接口
public interface SortedSet<E> extends Set<E> {
Comparator<? super E> comparator();
SortedSet<E> subSet(E fromElement, E toElement);
SortedSet<E> headSet(E toElement);
SortedSet<E> tailSet(E fromElement);
E first();
}
從上面接口定義看,SortedSet接口是Set的一個子接口,它除了有一般Set的特性之外它元素在內部是有序的。它內部元素的順序取決於元素的排序規則,即元素順序取決於元素對comparable
接口的實現或者一個comparator
比較器,關於comparable和comparator的區別,可以參考:http://www.cnblogs.com/sunflower627/p/3158042.html
NavigableSet接口
public interface NavigableSet<E> extends SortedSet<E> {
NavigableSet<E> descendingSet();
Iterator<E> descendingIterator();
SortedSet<E> headSet(E toElement);
SortedSet<E> tailSet(E fromElement);
SortedSet<E> subSet(E fromElement, E toElement);
ceiling(), floor(), higher(), and lower()
...
}
從NavigableSet接口定義可以看到,它是SortedSet的一個子接口,並且提供了一些導航方法,至於這些導航方法的含義大家可以查看Java Doc。
所以,TreeSet的特點就是內部元素有序,並且有很多導航方法的實現。從第一部分Java集合類概覽中我們知道,Set有一個子接口SortedSet
,而SortedSet又有一個子接口NavigableSet
接口,Java API對SortedSet、NavigableSet接口的實現只有一個,就是TreeSet
。
2.3 Collection的Queue接口
Queue接口繼承自Collection
接口,它也代表了一個有序的隊列,不過這個隊列最大的特點就是新插入的元素位於隊列的尾部,移除的對象位於隊列的頭部,這類似於超市中結賬的隊列。
我們通過第一節的Java集合概覽已經知道,Queue接口還有一個子接口Deque,下面我們分別看一下JavaAPI對這兩個接口的定義:
Queue接口:
public interface Queue<E> extends Collection<E> {
boolean add(E e);
boolean offer(E e);
E remove();
E poll();
E peek();
}
Deque接口:
public interface Deque<E> extends Queue<E> {
void addFirst(E e);
void addLast(E e);
E removeFirst();
E removeFirst();
}
從這兩個接口的定義我想大家已經看出些端倪,Queue接口定義了一般隊列的操作方式,而Deque則是一個雙端隊列。
對於Queue
接口,Java API提供了兩個實現:
- java.util.LinkedList(也實現了Deque接口)
- java.util.PriorityQueue
LinkedList:前面的List章節已經提到,它是一個標準隊列。
PriorityQueue:隊列中的順序類似於TreeSet,取決於元素的排序規則,即元素對comparable接口的實現或者一個comparator比較器。
對於Deque接口,出了LinkList類之外還有一個實現:
- java.util.ArrayDeque
ArrayDeque:從名稱可以看出,其內部實現是一個數組。
三、Java 集合之 Map
從第一部分Java集合類概覽中我們知道,Map不是繼承自Collection接口,而是和Collection接口出於並列的位置。所以,Map的行爲和上面介紹的Collection的行爲由很大不同。Map的主要特點是它存放的元素爲key-value
對,我們看一下Map接口的定義:
public interface Map<K,V> {
V put(K key, V value);
boolean containsKey(Object key);
Set<Map.Entry<K, V>> entrySet();
int hashCode(); V get(Object key);
Set<K> keySet();
... ...
}
對於Map接口,Java API提供瞭如下實現:
- java.util.HashMap
- java.util.Hashtable
- java.util.EnumMap
- java.util.IdentityHashMap
- java.util.LinkedHashMap
- java.util.Properties
- java.util.TreeMap
- java.util.WeakHashMap
其中,我們最常用到的是HashMap和TreeMap。
HashMap中的key、value都是無序的。HashMap的內部實現非常值得研究,具體請參考HashMap內部實現
HashTable可以看做是HashMap的重量級實現,其中的大部分方法都加了synchronized關鍵字,是線程安全的。HashTable
與HashMap的另一個區別是HashMap的key-value
都允許爲null,而HashTable不
可以。
LinkedHashMap也是一個HashMap,只是內部維護了一個雙向鏈表以保持順序,LinkedHashSet
內部實現就是用的LinkedHashMap。
TreeMap中的key、value不但可以保持順序,類似於TreeSet
和PriorityQueue
,TreeMap中key、value的迭代順序取決於它們各自的排序規則。