Java Collection 容器類分析與示例

Java中的Collection是最基本的集合接口，一個Collection代表一組Object，即Collection的元素（Elements）。一些Collection允許相同的元素而另一些不行。一些能排序而另一些不行。Java SDK不提供直接繼承自Collection的類，Java SDK提供的類都是繼承自Collection的“子接口”如List，set和map。所有實現Collection接口的類都必須提供兩個標準的構造函數：無參數的構造函數用於創建一個空的Collection，有一個Collection參數的構造函數用於創建一個新的Collection，這個新的Collection與傳入的Collection有相同的元素。後一個構造函數允許用戶複製一個Collection。

（1）List接口（數組類接口）

List是有序的Collection，使用此接口能夠精確的控制每個元素插入的位置。用戶能夠使用索引（元素在List中的位置，類似於數組下標）來訪問List中的元素，這類似於Java的數組。List允許有相同的元素。除了具有Collection接口必備的iterator()方法外，List還提供一個listIterator()方法，返回一個ListIterator接口，和標準的Iterator接口相比，ListIterator多了一些add()之類的方法，允許添加，刪除，設定元素，還能向前或向後遍歷。實現List接口的常用類有LinkedList，ArrayList，Vector和Stack。

1）LinkedList類

LinkedList實現了List接口，允許null元素。此外LinkedList提供額外的get，remove，insert方法在LinkedList的首部或尾部。這些操作使LinkedList可被用作堆棧（stack），隊列（queue）或雙向隊列（deque）。LinkedList沒有同步方法。如果多個線程同時訪問一個List，則必須自己實現訪問同步。一種解決方法是在創建List時構造一個同步的List：List list = Collections.synchronizedList(new LinkedList(…));

2）ArrayList類
ArrayList實現了可變大小的數組，可以認爲是可變大小的隊列，可以在任意位置添加和刪除元素。隊列是一種先進先出（FIFO）的線性表。它是有下標的，長度可變的，可重複的。在Java中的隊列與我們以前接觸過的C裏面的隊列還是有一點點區別的。筆者認爲其主要區別是：在C中，隊列只允許在隊尾作插入操作，在隊頭作刪除操作；而java中是可以指定位置的，相對來說，這對我們的操作會帶來很大的方便。它允許所有元素，包括null。ArrayList沒有同步。size，isEmpty，get，set方法運行時間爲常數。但是add方法開銷爲分攤的常數，添加n個元素需要O(n)的時間。其他的方法運行時間爲線性。每個ArrayList實例都有一個容量（Capacity），即用於存儲元素的數組的大小。這個容量可隨着不斷添加新元素而自動增加，但是增長算法並沒有定義。當需要插入大量元素時，在插入前可以調用ensureCapacity方法來增加ArrayList的容量以提高插入效率。和LinkedList一樣，ArrayList也是非同步的（unsynchronized）。

3）Vector類
Vector與ArrayList類似，但Vector是同步的。由Vector創建的Iterator，雖然和ArrayList創建的Iterator是同一接口，但是，因爲Vector是同步的，當一個Iterator被創建而且正在被使用，另一個線程改變了Vector的狀態（例如，添加或刪除了一些元素），這時調用Iterator的方法時將拋出ConcurrentModificationException，因此必須捕獲該異常。

4）Stack 類
Stack繼承自Vector，實現一個後進先出的堆棧。Stack提供5個額外的方法使得Vector得以被當作堆棧使用。基本的push和pop方法，還有peek方法得到棧頂的元素，empty方法測試堆棧是否爲空，search方法檢測一個元素在堆棧中的位置。Stack剛創建後是空棧。

示例代碼：

public class ArrayListTestDriver {
	public static void main(String[] args){
		List<String> list = new ArrayList<String>();
		list.add("Charles");
		list.add("Nancy");
		Iterator it = list.iterator();
		//method 1
		while(it.hasNext()){
			System.out.println(it.next());
		}
		//method 2
		for(String s:list){
			System.out.println(s);
		}
		//method 3
		for(int i=0;i<list.size();i++){
			System.out.println(list.get(i));
		}
		
	}
}

（2）Set接口（集合類接口）

Set是一種不包含重複的元素的Collection，即任意的兩個元素e1和e2都有e1.equals(e2)=false，Set最多有一個null元素。
很明顯，Set的構造函數有一個約束條件，傳入的Collection參數不能包含重複的元素。請注意：必須小心操作可變對象（Mutable Object）。如果一個Set中的可變元素改變了自身狀態導致Object.equals(Object)=true將導致一些問題。

1）HashSet類

HashSet按Hash算法來存儲集合的元素，因此具有很好的存取和查找性能。HashSet的特點：HashSet不是同步的，多個線程訪問是需要通過代碼保證同步；集合元素值可以使null。HashSet集合判斷兩個元素相等的標準是兩個對象通過equals方法比較相等，並且兩個對象的hashCode（）方法返回值也相等。

對於HashSet類，即使2個A對象通過equals比較返回true，但HashSet依然把它們當成2個對象；即使2個B對象的hashCode（）返回相同值，但HashSet依然把它們當成2個對象。即如果把一個對象放入HashSet中時，如果重寫該對象equals（）方法，也應該重寫其hashCode（）方法。其規則是：如果2個對象通過equals方法比較返回true時，這兩個對象的hashCode也應該相同。

2）TreeSet類

TreeSet是SortedSet接口的唯一實現，TreeSet可以確保集合元素處於排序狀態（元素是有序的）。TreeSet提供了以下的方法

Comparator comparttor()：返回當前Set使用的Compara投入，或者返回null，表示以自然方式排序。
Object first()：返回集合中的第一個元素。
Object last()：返回集合中的最後一個元素。
Objiect lower(Object e)：返回集合中位於指定元素之前的元素（即小於指定元素的最大元素，參考元素可以不是TreeSet的元素）。
Object higher(Object e)：返回集合中位於指定元素之後的元素（即大於指定元素的最小元素，參考元素可以不需要TreeSet的元素）。
SortedSet subSet(fromElement， toElement)：返回此Set的子集，範圍從fromElement(包含大於等於）到toElement(不包含小於）。
SortedSet headSet(toElement)：返回此Set的子集，由小於toElement的元素組成。
SortedSet tailSet(fromElement)：返回此Set的子集，由大於或等於fromElement的元素組成。

TreeSet並不是根據元素的插入順序進行排序，而是根據元素實際值來進行排序。TreeSet採用紅黑樹的數據結構對元素進行排序。

示例代碼：

public class HashSetTest {
	public static void main(String[] args){
		Set<String> set = new HashSet<String>();
		set.add("God Bless");
		boolean r = set.add("God Bless");
		System.out.println("Result of add method is:"+r);
		System.out.println("The content of set is:"+ set);
	}
}

public class TreeSetTestDriver {
	public static void main(String[] args){
		TreeSet<Integer> numset = new TreeSet<Integer>();
		numset.add(new Integer(3));
		numset.add(new Integer(-5));
		numset.add(new Integer(232));
		numset.add(new Integer(56));
		numset.add(new Integer(0));
		System.out.println("The last num is:"+numset.last());
		System.out.println("The top 3 is:"+numset.tailSet(3));
		Iterator<Integer> it =  numset.iterator();
		while(it.hasNext()){
			System.out.println("The num of the numset is:"+it.next());
		}
		
	}
}

（3）Map接口（映射類接口）

        Map沒有繼承Collection接口，Map提供key到value的映射。一個Map中不能包含相同的key，每個key只能映射一個value。Map接口提供3種集合的視圖，Map的內容可以被當作一組key集合，一組value集合，或者一組key-value映射。我們知道函數有定義域和值域，這也就相當我們這裏講的映射所對應的K和V。其中K是一個set，不能重複，而V是允許重複的。

1）Hashtable類
Hashtable繼承Map接口，實現一個key-value映射的哈希表。任何非空（non-null）的對象都可作爲key或者value。
添加數據使用put(key, value)，取出數據使用get(key)，這兩個基本操作的時間開銷爲常數。Hashtable通過initial capacity和load factor兩個參數調整性能。通常缺省的load factor 0.75較好地實現了時間和空間的均衡。增大load factor可以節省空間但相應的查找時間將增大，這會影響像get和put這樣的操作。Hashtable是同步的。

2）HashMap類
        HashMap和Hashtable類似，不同之處在於HashMap是非同步的，並且允許null，即null value和null key。，但是將HashMap視爲Collection時（values()方法可返回Collection），其迭代子操作時間開銷和HashMap的容量成比例。因此，如果迭代操作的性能相當重要的話，不要將HashMap的初始化容量設得過高，或者load factor過低。

3）WeakHashMap類
         WeakHashMap是一種改進的HashMap，它對key實行“弱引用”，如果一個key不再被外部所引用，那麼該key可以被回收。

示例代碼：

public class HashMapTestDriver {
	public static void main(String[] args){
		Map<String, String> hashmap = new HashMap<String, String>();
		hashmap.put("Charles", "25104526");
		hashmap.put("Nacy", "25632356");
		hashmap.put("Zhang", "25562866");
		Iterator<Map.Entry<String,String>> it = hashmap.entrySet().iterator();
		for(Map.Entry<String,String> entry:hashmap.entrySet()){
			System.out.println("The key is: "+entry.getKey()+", "+"The value is: "+entry.getValue());
		}		
	}
}

集合類性能效率總結

注意，這裏展示的類都是非線程安全的。如果需要考慮線程安全，應該使用ConcurrentMap,CopyOnWriteArrayList,CopyOnWriteArraySet等。

接口	實現類	保持插入順序	可重複	排序	使用說明
List	ArrayList	Y	Y	N	長於隨機訪問元素；但插入、刪除元素較慢（數組特性）。
List	LinkedList	Y	Y	N	插入、刪除元素較快，但隨即訪問較慢（鏈表特性）。
Set	HashSet	N	N	N	使用散列，最快的獲取元素方法。
	TreeSet	N	N	Y	將元素存儲在紅-黑樹數據結構中。默認爲升序。
	LinkedHashSet	Y	N	N	使用散列，同時使用鏈表來維護元素的插入順序。
Map	HashMap	N	N	N	使用散列，提供最快的查找技術。
	TreeMap	N	N	Y	默認按照比較結果的升序保存鍵。
	LinkedHashMap	Y	N	N	按照插入順序保存鍵，同時使用散列提高查找速度。

總結：

① 如果涉及到堆棧，隊列等操作，應該考慮用List。如果要進行大量的隨機訪問，應使用ArrayList；如果經常進行插入與刪除操作，用使用LinkedList。

② HashMap設計用來快速訪問；而TreeMap保持“鍵”始終處於排序狀態，所以沒有HashMap快。LinkedHashMap保持元素插入的順序，但是也通過散列提供了快速訪問能力。

③ Set不接受重複元素。HashSet提供最快的查詢速度，而TreeSet保持元素處於排序狀態。LinkedHashSet以插入順序保存元素。

④ 對哈希表的操作，作爲key的對象要正確重寫equals和hashCode方法。

⑤ 儘量返回接口而非實際的類型（針對抽象編程），如返回List而非ArrayList，這樣如果以後需要將ArrayList換成LinkedList時，客戶端代碼不用改變。

⑥ 程序中不應該使用過時的Vector\Hashtable\Stack。

本文使用了“子孑” 博客部分內容，http://zhangjunhd.blog.51cto.com/113473/69677，在此表示感謝

Java Collection 容器類分析與示例

Spring Cloud 部署時如何使用 Kubernetes 作爲註冊中心和配置中心

中文分詞算法

爲何有些雲比其他雲更可信

二叉樹的遞歸算法

C++內存管理詳解

重讀經典-《Effective C++》Item2：儘量以const,enum,inline替換#define

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結