有一個問題困擾著許多初學java的新手們,那就是有必要去學習數(shù)據(jù)結構嗎?雖然你可能沒有特意去看一些數(shù)據(jù)結構的專業(yè)書籍,你仍然可以用java做一份還過得去的工作,不過并不是說你完全沒有接觸到數(shù)據(jù)結構,因為java已經在底層幫你做了太多,在你和數(shù)據(jù)結構打交道的時候,你所做更多的是在調用 API 。當你的代碼量累積到一定程度的時候,就會想要去加強數(shù)據(jù)結構和算法的相關知識了。
打個比方,你可以把java看做是自動檔轎車,數(shù)據(jù)結構呢就是變速箱的工作原理。你完全可以不知道變速箱怎樣工作,就把自動檔的車子開上路,而且未必就比懂得的人慢。寫程序這件事,和開車一樣,經驗可以起到很大作用,但如果你不知道底層是怎么工作的,就永遠只能開車,既不會修車,也不能造車。如果你對這兩件事都不感興趣也就罷了,數(shù)據(jù)結構懂得用就好。但若你此生在編程領域還有點更高的追求,數(shù)據(jù)結構是繞不開的課題。
此外,很重要的一點是,數(shù)據(jù)結構也是通向各種實用算法的基石,所以學習數(shù)據(jù)結構都是提升內力的事情。這里推薦一本書《Java數(shù)據(jù)結構和算法》,這本書以一種易懂的方式教授如何安排和操縱數(shù)據(jù)的問題,它使用java語言說明重要的概念,而避免了C/C++語言的復雜性,以便集中精力論述數(shù)據(jù)結構和算法。經驗豐富的作者RorbertLafore先生提供了許多簡單明了的例子,避免了對于這類例題常見的冗長、繁鎖的數(shù)學證明。在本書的每一章后都有問題和練習,使讀者有機會測試自己的理解程度。
Iterator it = collection.iterator(); // 獲得一個迭代子
while(it.hasNext()) {
Object obj = it.next(); // 得到下一個元素
}
由Collection接口派生的兩個接口是List和Set。主要方法:
1、boolean add(Object o)添加對象到集合
2、boolean remove(Object o)刪除指定的對象
3、int size()返回當前集合中元素的數(shù)量
4、boolean contains(Object o)查找集合中是否有指定的對象
5、boolean isEmpty()判斷集合是否為空
6、Iterator iterator()返回一個迭代器
7、boolean containsAll(Collection c)查找集合中是否有集合c中的元素
8、boolean addAll(Collection c)將集合c中所有的元素添加給該集合
9、void clear()刪除集合中所有元素
10、void removeAll(Collection c)從集合中刪除c集合中也有的元素
11、void retainAll(Collection c)從集合中刪除集合c中不包含的元素
List接口
List是有序的Collection,使用此接口能夠精確的控制每個元素插入的位置。用戶能夠使用索引(元素在List中的位置,類似于數(shù)組下標)來訪問List中的元素,這類似于Java的數(shù)組。
和下面要提到的Set不同,List允許有相同的元素。
除了具有Collection接口必備的iterator()方法外,List還提供一個listIterator()方法,返回一個ListIterator接口,和標準的Iterator接口相比,ListIterator多了一些add()之類的方法,允許添加,刪除,設定元素,還能向前或向后遍歷。
實現(xiàn)List接口的常用類有LinkedList,ArrayList,Vector和Stack。
主要方法:
1、void add(int index,Object element)在指定位置上添加一個對象
2、boolean addAll(int index,Collection c)將集合c的元素添加到指定的位置
3、Object get(int index)返回List中指定位置的元素
4、int indexOf(Object o)返回第一個出現(xiàn)元素o的位置.
5、Object removeint(int index)刪除指定位置的元素
6、Object set(int index,Object element)用元素element取代位置index上的元素,返回被取代的元素
LinkedList類
LinkedList實現(xiàn)了List接口,允許null元素。此外LinkedList提供額外的get,remove,insert方法在LinkedList的首部或尾部。這些操作使LinkedList可被用作堆棧(stack),隊列(queue)或雙向隊列(deque)。
注意LinkedList沒有同步方法。如果多個線程同時訪問一個List,則必須自己實現(xiàn)訪問同步。一種解決方法是在創(chuàng)建List時構造一個同步的List:
List list = Collections.synchronizedList(new LinkedList(...));
ArrayList類
ArrayList實現(xiàn)了可變大小的數(shù)組。它允許所有元素,包括null。ArrayList沒有同步。
size,isEmpty,get,set方法運行時間為常數(shù)。但是add方法開銷為分攤的常數(shù),添加n個元素需要O(n)的時間。其他的方法運行時間為線性。
每個ArrayList實例都有一個容量(Capacity),即用于存儲元素的數(shù)組的大小。這個容量可隨著不斷添加新元素而自動增加,但是增長算法并沒有定義。當需要插入大量元素時,在插入前可以調用ensureCapacity方法來增加ArrayList的容量以提高插入效率。
和LinkedList一樣,ArrayList也是非同步的(unsynchronized)。
主要方法:
1、Boolean add(Object o)將指定元素添加到列表的末尾
2、Boolean add(int index,Object element)在列表中指定位置加入指定元素
3、Boolean addAll(Collection c)將指定集合添加到列表末尾
4、Boolean addAll(int index,Collection c)在列表中指定位置加入指定集合
5、Boolean clear()刪除列表中所有元素
6、Boolean clone()返回該列表實例的一個拷貝
7、Boolean contains(Object o)判斷列表中是否包含元素
8、Boolean ensureCapacity(int m)增加列表的容量,如果必須,該列表能夠容納m個元素
9、Object get(int index)返回列表中指定位置的元素
10、Int indexOf(Object elem)在列表中查找指定元素的下標
11、Int size()返回當前列表的元素個數(shù)
Vector類
Vector非常類似ArrayList,但是Vector是同步的。由Vector創(chuàng)建的Iterator,雖然和ArrayList創(chuàng)建的Iterator是同一接口,但是,因為Vector是同步的,當一個Iterator被創(chuàng)建而且正在被使用,另一個線程改變了Vector的狀態(tài)(例如,添加或刪除了一些元素),這時調用Iterator的方法時將拋出ConcurrentModificationException,因此必須捕獲該異常。
Stack 類
Stack繼承自Vector,實現(xiàn)一個后進先出的堆棧。Stack提供5個額外的方法使得Vector得以被當作堆棧使用。基本的push和pop方法,還有peek方法得到棧頂?shù)脑?,empty方法測試堆棧是否為空,search方法檢測一個元素在堆棧中的位置。Stack剛創(chuàng)建后是空棧。
Set接口
Set是一種不包含重復的元素的Collection,即任意的兩個元素e1和e2都有e1.equals(e2)=false,Set最多有一個null元素。
很明顯,Set的構造函數(shù)有一個約束條件,傳入的Collection參數(shù)不能包含重復的元素。
請注意:必須小心操作可變對象(Mutable Object)。如果一個Set中的可變元素改變了自身狀態(tài)導致Object.equals(Object)=true將導致一些問題。
Map接口
請注意,Map沒有繼承Collection接口,Map提供key到value的映射。一個Map中不能包含相同的key,每個key只能映射一個value。Map接口提供3種集合的視圖,Map的內容可以被當作一組key集合,一組value集合,或者一組key-value映射。
主要方法:
1、boolean equals(Object o)比較對象
2、boolean remove(Object o)刪除一個對象
3、put(Object key,Object value)添加key和value
Hashtable類
Hashtable繼承Map接口,實現(xiàn)一個key-value映射的哈希表。任何非空(non-null)的對象都可作為key或者value。
添加數(shù)據(jù)使用put(key, value),取出數(shù)據(jù)使用get(key),這兩個基本操作的時間開銷為常數(shù)。
Hashtable通過initial capacity和load factor兩個參數(shù)調整性能。通常缺省的load factor 0.75較好地實現(xiàn)了時間和空間的均衡。增大load factor可以節(jié)省空間但相應的查找時間將增大,這會影響像get和put這樣的操作。
使用Hashtable的簡單示例如下,將1,2,3放到Hashtable中,他們的key分別是”one”,”two”,”three”:
Hashtable numbers = new Hashtable();
numbers.put(“one”, new Integer(1));
numbers.put(“two”, new Integer(2));
numbers.put(“three”, new Integer(3));
Integer n = (Integer)numbers.get(“two”);
System.out.println(“two = ” + n);
由于作為key的對象將通過計算其散列函數(shù)來確定與之對應的value的位置,因此任何作為key的對象都必須實現(xiàn)hashCode和equals方法。hashCode和equals方法繼承自根類Object,如果你用自定義的類當作key的話,要相當小心,按照散列函數(shù)的定義,如果兩個對象相同,即obj1.equals(obj2)=true,則它們的hashCode必須相同,但如果兩個對象不同,則它們的hashCode不一定不同,如果兩個不同對象的hashCode相同,這種現(xiàn)象稱為沖突,沖突會導致操作哈希表的時間開銷增大,所以盡量定義好的hashCode()方法,能加快哈希表的操作。
如果相同的對象有不同的hashCode,對哈希表的操作會出現(xiàn)意想不到的結果(期待的get方法返回null),要避免這種問題,只需要牢記一條:要同時復寫equals方法和hashCode方法,而不要只寫其中一個。
Hashtable是同步的。
HashMap類
HashMap和Hashtable類似,不同之處在于HashMap是非同步的,并且允許null,即null value和null key。,但是將HashMap視為Collection時(values()方法可返回Collection),其迭代子操作時間開銷和HashMap的容量成比例。因此,如果迭代操作的性能相當重要的話,不要將HashMap的初始化容量設得過高,或者load factor過低。
WeakHashMap類
WeakHashMap是一種改進的HashMap,它對key實行“弱引用”,如果一個key不再被外部所引用,那么該key可以被GC回收。
總結
如果涉及到堆棧,隊列等操作,應該考慮用List,對于需要快速插入,刪除元素,應該使用LinkedList,如果需要快速隨機訪問元素,應該使用ArrayList。
如果程序在單線程環(huán)境中,或者訪問僅僅在一個線程中進行,考慮非同步的類,其效率較高,如果多個線程可能同時操作一個類,應該使用同步的類。
要特別注意對哈希表的操作,作為key的對象要正確復寫equals和hashCode方法。
盡量返回接口而非實際的類型,如返回List而非ArrayList,這樣如果以后需要將ArrayList換成LinkedList時,客戶端代碼不用改變。這就是針對抽象編程。
更多建議: