在編程中,常常需要集中存放多個數據。從傳統意義上講,數組是我們的一個很好的選擇,前提是我們事先已經明確知道我們將要保存的對象的數量。一旦在數組初始化時指定了這個數組長度,這個數組長度就是不可變的,如果我們需要保存一個可以動態增長的數據(在編譯時無法確定具體的數量),java的集合類就是一個很好的設計方案了。
集合類主要負責保存、盛裝其他數據,因此集合類也被稱爲容器類。所以的集合類都位於java.util包下,後來爲了處理多線程環境下的併發安全問題,java5還在java.util.concurrent包下提供了一些多線程支持的集合類。
在學習Java中的集合類的API、編程原理的時候,我們一定要明白,"集合"是一個很古老的數學概念,它遠遠早於Java的出現。從數學概念的角度來理解集合能幫助我們更好的理解編程中什麼時候該使用什麼類型的集合類。
Java容器類類庫的用途是"保存對象",並將其劃分爲兩個不同的概念:
1) Collection
一組"對立"的元素,通常這些元素都服從某種規則
1.1) List必須保持元素特定的順序
1.2) Set不能有重複元素
1.3) Queue保持一個隊列(先進先出)的順序
2) Map
一組成對的"鍵值對"對象
Collection和Map的區別在於容器中每個位置保存的元素個數:
1) Collection 每個位置只能保存一個元素(對象)
2) Map保存的是"鍵值對",就像一個小型數據庫。我們可以通過"鍵"找到該鍵對應的"值"
Interface Iterable
迭代器接口,這是Collection類的父接口。實現這個Iterable接口的對象允許使用foreach進行遍歷,也就是說,所有的Collection集合對象都具有"foreach可遍歷性"。這個Iterable接口只有一個方法: iterator()。它返回一個代表當前集合對象的泛型<T>迭代器,用於之後的遍歷操作
List,Set,Map是否繼承自Collection接口? 答:List,Set是,Map不是。
如圖:
Collection
├List
│├LinkedList
│├ArrayList
│└Vector
│└Stack
└Set
Collection是最基本的集合接口,一個Collection代表一組Object,即Collection的元素。一些Collection允許相同的元素而另一些不行。一些能排序而另一些不行。Java JDK不能提供直接繼承自Collection的類,Java JDK提供的類都是繼承自Collection的"子接口",如:List和Set。
注意:Map沒有繼承Collection接口,Map提供key到value的映射。一個Map中不能包含相同key,每個key只能映射一個value。Map接口提供3種集合的視圖,Map的內容可以被當做一組key集合,一組value集合,或者一組key-value映射。
詳細介紹:
List特點:元素有放入順序,元素可重複
Map特點:元素按鍵值對存儲,無放入順序
Set特點:元素無放入順序,元素不可重複(注意:元素雖然無放入順序,但是元素在set中的位置是有該元素的HashCode決定的,其位置其實是固定的)
List接口有三個實現類:LinkedList,ArrayList,Vector
LinkedList:底層基於鏈表實現,鏈表內存是散亂的,每一個元素存儲本身內存地址的同時還存儲下一個元素的地址。鏈表增刪快,查找慢
ArrayList和Vector的區別:ArrayList是非線程安全的,效率高;Vector是基於線程安全的,效率低
Set接口有兩個實現類:HashSet(底層由HashMap實現),LinkedHashSet
SortedSet接口有一個實現類:TreeSet(底層由平衡二叉樹實現)
Query接口有一個實現類:LinkList
Map接口有三個實現類:HashMap,HashTable,LinkeHashMap
HashMap非線程安全,高效,支持null;HashTable線程安全,低效,不支持null
SortedMap有一個實現類:TreeMap
其實最主要的是,list是用來處理序列的,而set是用來處理集的。Map是知道的,存儲的是鍵值對
set 一般無序不重複.map kv 結構 list 有序
java集合的主要分爲三種類型:
·Set(集)
·List(列表)
·Map(映射)
Java所有“存儲及隨機訪問一連串對象”的做法,array是最有效率的一種。
1、效率高,但容量固定且無法動態改變。
array還有一個缺點是,無法判斷其中實際存有多少元素,length只是告訴我們array的容量。
2、Java中有一個Arrays類,專門用來操作array。
arrays中擁有一組static函數,
equals():比較兩個array是否相等。array擁有相同元素個數,且所有對應元素兩兩相等。
fill():將值填入array中。
sort():用來對array進行排序。
binarySearch():在排好序的array中尋找元素。
System.arraycopy():array的複製。
若撰寫程序時不知道究竟需要多少對象,需要在空間不足時自動擴增容量,則需要使用容器類庫,array不適用。所以就要用到集合。
那我們開始討論java中的集合。
集合分類:
Collection:List、Set
Map:HashMap、HashTable
1.Collection接口
Collection是最基本的集合接口,聲明瞭適用於JAVA集合(只包括Set和List)的通用方法。Set 和List都繼承了Conllection。
1.1 Collection接口的方法:
boolean add(Object o):向集合中加入一個對象的引用
void clear():刪除集合中所有的對象,即不再持有這些對象的引用
boolean isEmpty():判斷集合是否爲空
boolean contains(Object o): 判斷集合中是否持有特定對象的引用
Iterartor iterator():返回一個Iterator對象,可以用來遍歷集合中的元素
boolean remove(Object o):從集合中刪除一個對象的引用
int size():返回集合中元素的數目
Object[] toArray(): 返回一個數組,該數組中包括集合中的所有元素
關於:Iterator()和toArray() 方法都用於集合的所有的元素,前者返回一個Iterator對象,後者返回一個包含集合中所有元素的數組。
1.2 Iterator接口聲明瞭如下方法:
hasNext():判斷集合中元素是否遍歷完畢,如果沒有,就返回true
next() :返回下一個元素
remove():從集合中刪除上一個有next()方法返回的元素。
集合類的分類
· Collection(一組對立的元素)
o List(有順序)
o Set(不能有重複元素)
o Queue(保存隊列先進先出 的順序)
· Map(鍵值對(key-value))
1.2 Set(集合)
Set是最簡單的一種集合。集合中的對象不按特定的方式排序,並且沒有重複對象。Set接口主要實現了兩個實現類:
· HashSet: HashSet類按照哈希算法來存取集合中的對象,存取速度比較快
· TreeSet :TreeSet類實現了SortedSet接口,能夠對集合中的對象進行排序。
Set具有與Collection完全一樣的接口,因此沒有任何額外的功能,不像前面有兩個不同的List。實際上Set就是Collection,只是行爲不同。(這是繼承與多態思想的典型應用:表現不同的行爲。)Set不保存重複的元素(至於如何判斷元素相同則較爲負責)
Set : 存入Set的每個元素都必須是唯一的,因爲Set不保存重複元素。加入Set的元素必須定義equals()方法以確保對象的唯一性。Set與Collection有完全一樣的接口。Set接口不保證維護元素的次序。
HashSet:爲快速查找設計的Set。存入HashSet的對象必須定義hashCode()。
TreeSet: 保存次序的Set, 底層爲樹結構。使用它可以從Set中提取有序的序列。
LinkedHashSet:具有HashSet的查詢速度,且內部使用鏈表維護元素的順序(插入的次序)。於是在使用迭代器遍歷Set時,結果會按元素插入的次序顯示。
1.3 List(列表)
List的特徵是其元素以線性方式存儲,集合中可以存放重複對象S。
List接口主要實現類包括:(參考文章:ArrayList與LinkedList的區別)
·ArrayList() : 代表長度可以改變得數組。可以對元素進行隨機的訪問,向ArrayList()中插入與刪除元素的速度慢。
·LinkedList(): 在實現中採用鏈表數據結構。插入和刪除速度快,訪問速度慢。
對於List的隨機訪問來說,就是隻隨機來檢索位於特定位置的元素。 List 的 get(int index) 方法放回集合中由參數index指定的索引位置的對象,下標從“0” 開始。最基本的兩種檢索集合中的所有對象的方法:
List的功能方法
實際上有兩種List:一種是基本的ArrayList,其優點在於隨機訪問元素,另一種是更強大的LinkedList,它並不是爲快速隨機訪問設計的,而是具有一套更通用的方法。
List:次序是List最重要的特點:它保證維護元素特定的順序。List爲Collection添加了許多方法,使得能夠向List中間插入與移除元素(這隻推薦LinkedList使用。)一個List可以生成ListIterator,使用它可以從兩個方向遍歷List,也可以從List中間插入和移除元 素。
ArrayList:由數組實現的List。允許對元素進行快速隨機訪問,但是向List中間插入與移除元素的速度很慢。ListIterator只應該用來由後向前遍歷ArrayList,而不是用來插入和移除元素。因爲那比LinkedList開銷要大很多。
LinkedList :對順序訪問進行了優化,向List中間插入與刪除的開銷並不大。隨機訪問則相對較慢。(使用ArrayList代替。)還具有下列方 法:addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast(), 這些方法 (沒有在任何接口或基類中定義過)使得LinkedList可以當作堆棧、隊列和雙向隊列使用。
Vector,ArrayList, LinkedList的區別是什麼?
答:
1、Vector、ArrayList都是以類似數組的形式存儲在內存中,LinkedList則以鏈表的形式進行存儲。
2、List中的元素有序、允許有重複的元素,Set中的元素無序、不允許有重複元素。
3、Vector線程同步,ArrayList、LinkedList線程不同步。
4、LinkedList適合指定位置插入、刪除操作,不適合查找;ArrayList、Vector適合查找,不適合指定位置的插入、刪除操作。
5、ArrayList在元素填滿容器時會自動擴充容器大小的50%,而Vector則是100%,因此ArrayList更節省空間。
詳見:http://www.cnblogs.com/mgod/archive/2007/08/05/844011.html
1.4 Map(映射)
Map是一種把鍵對象和值對象映射的集合,它的每一個元素都包含一對鍵對象和值對象。 Map沒有繼承於Collection接口 從Map集合中檢索元素時,只要給出鍵對象,就會返回對應的值對象。
Map 的常用方法:
1 添加,刪除操作:
1.Object put(Object key, Object value): 向集合中加入元素
2.Object remove(Object key): 刪除與KEY相關的元素
3.void putAll(Map t): 將來自特定映像的所有元素添加給該映像
4.void clear():從映像中刪除所有映射
2 查詢操作:
Object get(Object key):獲得與關鍵字key相關的值 。Map集合中的鍵對象不允許重複,也就說,任意兩個鍵對象通過equals()方法比較的結果都是false.,但是可以將任意多個鍵獨享映射到同一個值對象上。
Map的功能方法
方法put(Object key, Object value)添加一個“值”(想要得東西)和與“值”相關聯的“鍵”(key)(使用它來查找)。方法get(Object key)返回與給定“鍵”相關聯的“值”。可以用containsKey()和containsValue()測試Map中是否包含某個“鍵”或“值”。 標準的Java類庫中包含了幾種不同的Map:HashMap, TreeMap, LinkedHashMap, WeakHashMap, IdentityHashMap。它們都有同樣的基本接口Map,但是行爲、效率、排序策略、保存對象的生命週期和判定“鍵”等價的策略等各不相同。
執行效率是Map的一個大問題。看看get()要做哪些事,就會明白爲什麼在ArrayList中搜索“鍵”是相當慢的。而這正是HashMap提高速 度的地方。HashMap使用了特殊的值,稱爲“散列碼”(hash code),來取代對鍵的緩慢搜索。“散列碼”是“相對唯一”用以代表對象的int值,它是通過將該對象的某些信息進行轉換而生成的。所有Java對象都 能產生散列碼,因爲hashCode()是定義在基類Object中的方法。
HashMap就是使用對象的hashCode()進行快速查詢的。此方法能夠顯着提高性能。
Map : 維護“鍵值對”的關聯性,使你可以通過“鍵”查找“值”
HashMap:Map基於散列表的實現。插入和查詢“鍵值對”的開銷是固定的。可以通過構造器設置容量capacity和負載因子load factor,以調整容器的性能。
LinkedHashMap: 類似於HashMap,但是迭代遍歷它時,取得“鍵值對”的順序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一點。而在迭代訪問時發而更快,因爲它使用鏈表維護內部次序。
TreeMap : 基於紅黑樹數據結構的實現。查看“鍵”或“鍵值對”時,它們會被排序(次序由Comparabel或Comparator決定)。TreeMap的特點在於,你得到的結果是經過排序的。TreeMap是唯一的帶有subMap()方法的Map,它可以返回一個子樹。
WeakHashMap :弱鍵(weak key)Map,Map中使用的對象也被允許釋放:這是爲解決特殊問題設計的。如果沒有map之外的引用指向某個“鍵”,則此“鍵”可以被垃圾收集器回收。
IdentifyHashMap:: 使用==代替equals()對“鍵”作比較的hash map。專爲解決特殊問題而設計。
1.5區別
1.5.1、Collection和 Map 的區別
容器內每個爲之所存儲的元素個數不同。
Collection類型者,每個位置只有一個元素。
Map類型者,持有 key-value pair,像個小型數據庫。
1.4.2、各自旗下的子類關係
Collection
--List:將以特定次序存儲元素。所以取出來的順序可能和放入順序不同。
--ArrayList / LinkedList / Vector
--Set : 不能含有重複的元素
--HashSet / TreeSet
Map
--HashMap
--HashTable
--TreeMap
1.4.3、其他特徵
List,Set,Map將持有對象一律視爲Object型別。
Collection、List、Set、Map都是接口,不能實例化。
它們的實現類 ArrayList, Vector, HashTable, HashMap是具象class,這些纔可被實例化。
vector容器確切知道它所持有的對象隸屬什麼型別。vector不進行邊界檢查。
總結
1. 如果涉及到堆棧,隊列等操作,應該考慮用List,對於需要快速插入,刪除元素,應該使用LinkedList,如果需要快速隨機訪問元素,應該使用ArrayList。
2. 如果程序在單線程環境中,或者訪問僅僅在一個線程中進行,考慮非同步的類,其效率較高,如果多個線程可能同時操作一個類,應該使用同步的類。
3. 在除需要排序時使用TreeSet,TreeMap外,都應使用HashSet,HashMap,因爲他們
的效率更高。
4. 要特別注意對哈希表的操作,作爲key的對象要正確複寫equals和hashCode方法。
5. 容器類僅能持有對象引用(指向對象的指針),而不是將對象信息copy一份至數列某位置。一旦將對象置入容器內,便損失了該對象的型別信息。
6. 儘量返回接口而非實際的類型,如返回List而非ArrayList,這樣如果以後需要將ArrayList換成LinkedList時,客戶端代碼不用改變。這就是針對抽象編程。
注意:
1、Collection沒有get()方法來取得某個元素。只能通過iterator()遍歷元素。
2、Set和Collection擁有一模一樣的接口。
3、List,可以通過get()方法來一次取出一個元素。使用數字來選擇一堆對象中的一個,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList構造堆棧stack、隊列queue。
5、Map用put(k,v) / get(k),還可以使用containsKey()/containsValue()來檢查其中是否含有某個key/value。
HashMap會利用對象的hashCode來快速找到key。
6、Map中元素,可以將key序列、value序列單獨抽取出來。
使用keySet()抽取key序列,將map中的所有keys生成一個Set。
使用values()抽取value序列,將map中的所有values生成一個Collection。
爲什麼一個生成Set,一個生成Collection?那是因爲,key總是獨一無二的,value允許重複。
參考:http://www.cnblogs.com/LittleHann/p/3690187.html