C++ STL編程

一、STL簡介

1.1 初識STL

STL(Standard Template Library,即標準模版庫)是一個具有工業級強度的,高效的C++程序庫。它被容納於C++標準程序庫(C++ Standard Library)中,是ANSI/ISO C++標準中最新的也是極具革命性的一部分。該庫包含了諸多在計算機科學領域所常用的基本數據結構和基本算法。爲廣大C++程序員提供了一個可擴展的應用框架,高度體現了軟件的可複用性。這種現象有些類似於Microsoft Visual C++中的MFC(Microsoft Foundation Class Library),或者是Borland C++ Builder中的VCL(Virsual Component Library)。

從邏輯層次來看,在STL中體現了泛型化程序設計思想(generic programming),引入諸多新的名詞,比如像需求(requirements),概念(concept),模型(model),容器(container),算法(algorithmn),迭代子(iterator)等。與OOP(object-oriented programming)中多態(polymorphism)一樣,泛型也是一種軟件的複用技術。

從實現層次看,整個STL是以一種類型參數化(type paramterized)的方式實現的,這種方式基於一個在早先C++標準中沒有出現的語言特性——模板(template)。如果查閱任何一個版本的STL源碼,你就會發現,模板作爲構成整個STL的基石是一件千真萬確的事。除此之外,還有許多C++的新特性爲STL的實現提供了方便。

1.2 STL的歷史

被譽爲STL之父的Alexander Stepanov,出生於蘇聯莫斯科,早在20世紀70年代後半期,他便已經開始考慮,在保證效率的前提下,將算法從諸多具體應用之中抽象出來的可能性,這便是後來泛型化思想的雛形。爲了驗證自己的思想,他和紐約州立大學教授Deepak Kapur,倫塞里爾技術學院教授David Musser共同開發了一種叫做Tecton的語言。儘管這次嘗試最終沒有取得實用性的成果,但卻給了Stepanov很大的啓示。

在隨後的幾年中,他又和David Musser等人先後用Schema語言(一種Lisp語言的變種)和Ada語言建立了一些大型程序庫。這其間,Alexander Stepanov開始意識到,在當時的面向對象程序設計思想中所存在的一些問題,比如抽象數據類型概念所存在的缺陷。Stepanov希望通過對軟件領域中各組成部分的分類,逐漸形成一種軟件設計的概念性框架。

1987年左右,在貝爾實驗室工作的Alexander Stepanov開始首次採用C++語言進行泛型軟件庫的研究。但遺憾的是,當時的C++語言還沒有引入模板(template)的語法,現在我們可以清楚的看到,模板概念之於STL實現,是何等重要。是時使然,採用繼承機制是別無選擇的。儘管如此,Stepanov還是開發出了一個龐大的算法庫。與此同時,在與Andrew Koenig(前ISO C++標準化委員會主席)和Bjarne Stroustrup(C++語言的創始人)等頂級大師們的共事過程中,Stepanov開始注意到C/C++語言在實現其泛型思想方面所具有的潛在優勢。就拿C/C++中的指針而言,它的靈活與高效運用,使後來的STL在實現泛型化的同時更是保持了高效率。另外,在STL中佔據極其重要地位的迭代子概念便是源自於C/C++中原生指針(native pointer)的抽象。

1988年,Alexander Stepanov開始進入惠普的Palo Alto實驗室工作,在隨後的4年中,他從事的是有關磁盤驅動器方面的工作。直到1992年,由於參加並主持了實驗室主任Bill Worley所建立的一個有關算法的研究項目,才使他重新回到了泛型化算法的研究工作上來。項目自建立之後,參與者從最初的8人逐漸減少,最後只剩下兩個人--Stepanove本人和Meng Lee。經過長時間的努力,最終,信念與汗水所換來的是一個包含有大量數據結構和算法部件的龐大運行庫。這便是現在的STL的雛形(同時也是STL的一個實現版本--HP STL)。

1993年,當時在貝爾實驗室的Andrew Koenig看到了Stepanove的研究成果,很是興奮。在他的鼓勵與幫助下,Stepanove於是年9月的聖何塞爲ANSI/ISO C++標準委員會做了一個相關演講(題爲"The Science of C++ Programming"),向委員們講述了其觀念。然後又於次年3月,在聖迭戈會議上,向委員會提交了一份建議書,以期使STL成爲C++標準庫的一部分。儘管這一建議十分龐大,以至於降低了被通過的可能性,但由於其所包含的新思想,投票結果以壓倒多數的意見認爲推遲對該建議的決定。

隨後,在衆人的幫助之下,包括Bjarne Stroustrup在內,Stepanove又對STL進行了改進。同時加入了一個封裝內存模式信息的抽象模塊,也就是現在STL中的allocator,它使STL的大部分實現都可以獨立於具體的內存模式,從而獨立於具體平臺。在同年夏季的滑鐵盧會議上,委員們以80%贊成,20%反對,最終通過了提案,決定將STL正式納入C++標準化進程之中,隨後STL便被放進了會議的工作文件中。自此,STL終於成爲了C++家族中的重要一員。

此後,隨着C++標準的不斷改進,STL也在不斷地作着相應的演化。直至1998年,ANSI/ISO C++標準正式定案,STL始終是C++標準中不可或缺的一大部件。

二、STL的框架

2.1 STL的分類

STL的代碼從廣義上講分爲三類:algorithm(算法)、container(容器)和iterator(迭代器)。幾乎所有的代碼都採用了模板類模板函數的方式,這相比於傳統的由函數和類組成的庫來說提供了更好的代碼重用機會。

在C++標準中,STL被組織爲下面13個頭文件:<algorithm>、<deque>、<functional>、<iterator>、<vector>、<list>、<map>、<memory>、<numeric>、<queue>、<set>、<stack>和<utility>。

2.2 算法

大家都能取得的一個共識是函數庫對數據類型的選擇對其可重用性起着至關重要的作用。舉例來說,一個求方根的函數,在使用浮點數作爲其參數類型的情況下的可重用性肯定比使用整型作爲它的參數類性要高。而C++通過模板的機制允許推遲對某些類型的選擇,直到真正想使用模板或者說對模板進行特化的時候,STL就利用了這一點提供了相當多的有用算法。它是在一個有效的框架中完成這些算法的——你可以將所有的類型劃分爲少數的幾類,然後就可以在模版的參數中使用一種類型替換掉同一種類中的其他類型。

算法(algorithm)是應用在容器上以各種方法處理其內容的行爲和功能。例如:有對容器內容排序、複製、檢索、合併等算法。在STL中,算法是由模板函數表現的。這些函數不是容器類的成員函數,相反它們是獨立的函數。令人吃驚的特點之一就是其算法是如此的通用,不僅可以將其用於STL容器,而且可以用於普通的C++數組或任何其他應用程序指定的容器。

STL提供了大約100個實現算法的模版函數,比如算法for_each將爲指定序列中的每一個元素調用指定的函數,stable_sort以你所指定的規則對序列進行穩定性排序等等。這樣一來,只要我們熟悉了STL之後,許多代碼可以被大大的化簡,只需要通過調用一兩個算法模板,就可以完成所需要的功能並大大地提升效率。

算法部分主要由頭文件<algorithm>,<numeric>和<functional>組成。

  • <algorithm>:是所有STL頭文件中最大的一個(儘管它很好理解),它是由一大堆模板函數組成的,可以認爲每個函數在很大程度上都是獨立的,其中常用到的功能範圍涉及到比較、交換、查找、遍歷操作、複製、修改、移除、反轉、排序、合併等等;
  • <numeric>:體積很小,只包括幾個在序列上面進行簡單數學運算的模版函數,包括加法和乘法在序列上的一些操作;
  • <functional>:其中定義了一些模板類,用以聲明函數對象。

2.3 容器

在實際的開發過程中,數據結構本身的重要性不會遜於操作於數據結構的算法的重要性,當程序中存在着對時間要求很高的部分時,數據結構的選擇就顯得更加重要。

經典的數據結構數量有限,但是我們常常重複着一些爲了實現向量、鏈表等結構而編寫的代碼,這些代碼都十分相似,只是爲了適應不同數據的變化而在細節上有所出入。STL容器就爲我們提供了這樣的方便,它允許我們重複利用已有的實現構造自己的特定類型下的數據結構,通過設置一些模版類,STL容器對最常用的數據結構提供了支持,這些模板的參數允許我們指定容器中元素的數據類型,可以將我們許多重複而乏味的工作簡化。

容器是數據在內存中的組織的方法,例如:數組、堆棧、隊列、鏈表、二叉樹等(這些都不是STL標準容器)。STL中的容器是一種存儲T(Template)類型值的有限集合的數據結構,容器的內部實現一般是類。這些值可以是對象本身,如果數據類型T代表的是class的化。

容器部分主要由頭文件<vector>,<list>,<deque>,<set>,<map>,<stack>和<queue>組成。對於常用的一些容器和容器適配器(可以看作由其它容器實現的容器),可以通過下表總結一下它們和相應頭文件的對應關係。

  • 向量(vector):連續存儲的元素<vector>;
  • 列表(list):由節點組成的雙向列表,每個節點包含着一個元素<list>;
  • 雙隊列(deque):連續存儲的指向不同元素的指針所組成的數組<deque>;
  • 集合(set):由節點組成的紅黑樹,每個節點都包含着一個元素,節點之間以某種作用於元素對的謂詞排列,沒有兩個不同的元素能夠擁有相同的次序<set>;
  • 多重集合(multiset):允許存在兩個次序相等的元素的集合<set>;
  • 棧(stack):後進先出的值的排列<stack>;
  • 隊列(queue):先進先出的值的排列<queue>;
  • 優先隊列(priority_queue):元素的次序是由作用於所存儲的值對上的某種謂詞決定的一種隊列<queue>;
  • 映射(map):由{鍵,值}對組成的集合,以某種作用於鍵對上的謂詞排列<map>;
  • 多重映射(multimap):允許鍵對有相等的次序的映射<map>。

2.4 迭代器

一旦選定一種容器類型和數據行爲(算法),那麼剩下唯一要做的就是用迭代器使其相互作用。可以把迭代器看作一個指向容器中元素的普通指針,可以如遞增一個指針那樣遞增迭代器,使其依次指向容器中每一個後繼的元素。迭代器是STL中的一個關鍵部分,因爲它將算法和容器連接在一起。

下面要說的迭代器從作用上來說是最基本的部分,可是理解起來比前兩者都要費力一些(至少筆者是這樣)。軟件設計有一個基本原則,所有的問題都可以通過引進一個間接層來簡化,這種簡化在STL中就是用迭代器來完成的。

概括來說,迭代器在STL中用來將算法和容器聯繫起來,起着一種黏和劑的作用。幾乎STL提供的所有算法都是通過迭代器存取元素序列進行工作的,每一個容器都定義了其本身所專有的迭代器,用以存取容器中的元素。

迭代器部分主要由頭文件<utility>,<iterator>和<memory>組成。

  • <utility>:是一個很小的頭文件,它包括了貫穿使用在STL中的幾個模版的聲明;
  • <iterator>:提供了迭代器使用的許多方法
  • <memory>:它以不同尋常的方式爲容器中的元素分配存儲空間,同時也爲某些算法執行期間產生的臨時對象提供機制;<memory>中的主要部分是模板類allocator,它負責產生所有容器中的默認分配器。

對於之前不太瞭解STL的讀者來說,上面的文字只是十分概括地描述了一下STL的框架,對您理解STL的機制乃至使用STL所起到的幫助微乎甚微,這不光是因爲深入STL需要對C++的高級應用有比較全面的瞭解,更因爲STL的三個部分算法、容器和迭代器三部分是互相牽制或者說是緊密結合的。從概念上講最基礎的部分是迭代器,可是直接學習迭代器會遇到許多抽象枯燥和繁瑣的細節,然而不真正理解迭代器又是無法直接進入另兩部分的學習的(至少對剖析源碼來說是這樣)。可以說,適應STL處理問題的方法是需要花費一定的時間的,但是以此爲代價,STL取得了一種十分可貴的獨立性,它通過迭代器能在儘可能少地知道某種數據結構的情況下完成對這一結構的運算,所以下決心鑽研STL的朋友們千萬不要被一時的困難擊倒。其實STL運用的模式相對統一,只要適應了它,從一個STL工具到另一個工具,都不會有什麼大的變化。

對於STL的使用,也普遍存在着兩種觀點。第一種認爲STL的最大作用在於充當經典的數據結構和算法教材,因爲它的源代碼涉及了許多具體實現方面的問題。第二種則認爲STL的初衷乃是爲了簡化設計,避免重複勞動,提高編程效率,因此應該是“應用至上”的,對於源代碼則不必深究。筆者則認爲分析源代碼和應用並不矛盾,通過分析源代碼也能提高我們對其應用的理解,當然根據具體的目的也可以有不同的側重。

三、50條忠告

  1. 把C++當成一門新的語言學習;
  2. 看《Thinking In C++》,不要看《C++變成死相》;
  3. 看《The C++ Programming Language》和《Inside The C++ Object Model》,不要因爲他們很難而我們自己是初學者所以就不看;
  4. 不要被VC、BCB、BC、MV、TC等詞彙所迷惑——他們都是集成開發環境,而我們要學的是一門語言;
  5. 不要放過任何一個看上去很簡單的小編程問題——他們往往並不那麼簡單,或者可以引申出很多知識點;
  6. 會用Visual C++,並不說明你就會C++;
  7. 學class並不難,template、STL、generic programming也不過如此——難的是長期堅持實踐和不遺餘力的博覽羣書;
  8. 如果不是天才的話,想學編程就不要想玩遊戲——你以爲你做到了,其實你的C++水平並沒有和你通關的能力一起變高——其實可以時刻記住:學習C++是爲了編遊戲的;
  9. 看Visual C++的樹,是學不了C++語言的;
  10. 把時髦的技術掛在嘴邊,還不如把過時的技術記在心裏;
  11. 學習編程最好的方法之一就是閱讀源代碼;
  12. 在任何時刻都不要認爲自己手中的書已經足夠了;
  13. 請閱讀《The Standard C++ Bible》(中文版:標準C++寶典),掌握C++標準;
  14. 看得懂的書,請仔細看;看不懂的書,請硬着頭皮看;
  15. 別指望看一遍書就能記住和掌握什麼——請看第二遍、第三遍。。。;
  16. 請看《Effective C++》和《More Effective C++》以及《Exceptional C++》;
  17. 不要停留在集成開發環境的搖籃上,要學會控制集成開發環境,還要學會用命令行方式處理程序;
  18. 和別人一起討論有意義的C++知識點,而不是真吵XX行不行或者YY與ZZ哪個好;
  19. 請看《程序設計實踐》,並嚴格的按照其要求去做;
  20. 不要因爲C和C++中有一些語法和關鍵字看上去相同,就認爲它們的意義和作用完全一樣;
  21. C++絕不是所謂的C的“擴充”——如果C++一開始就起名叫Z語言,你一定不會把C和Z語言聯繫得那麼緊密;
  22. 請不要認爲學過XX語言再改學C++會有什麼問題——你只不過又在學一門全新的語言而已;
  23. 讀完了《Inside The C++ Object Model》以後再來認定自己是不是已經學會了C++;
  24. 學習編程的祕訣是:編程、編程、再編程;
  25. 請留意下列書籍:《C++面向對象高效編程(C++ Effective Object-Oriented Software Construction)》、《面向對象軟件構造(Object-Oriented Software Construction)》、《設計模式(Design Patterns)》、《The Art of Computer Programming》;
  26. 請把書上的程序例子親手輸入到電腦上實踐,即使配套光盤中有源代碼;
  27. 把在書上看到的有意義的例子擴充;
  28. 請重視C++中的異常處理技術,並將其切實的運用到自己的程序中;
  29. 經常回顧自己以前寫過的程序,並嘗試重寫,把自己學到的新知識運用進去;
  30. 不要漏掉書中任何一個練習題——請全部做完並記錄下解題思路;
  31. C++語言和C++的集成開發環境要同時學習和掌握;
  32. 既然決定了學習C++,就請堅持下去,因爲學習程序設計語言的目的是掌握程序設計技術,而程序設計技術是跨語言的;
  33. 就讓C++語言的各種平臺和開發環境去激烈競爭把,我們要以學習C++語言本身爲主;
  34. 當你寫C++程序寫到一半卻發現自己用的方法很拙劣時,請不要馬上停手;請儘快將餘下的部分初略的完成以保證這個設計的完整性,然後分析自己的錯誤並重新設計和編寫;
  35. 別心急,設計C++的class確實不容易;自己程序中的class和自己的class設計水平是在不斷的編程實踐中完善和發展的;
  36. 決不要因爲程序“很小”就不遵循某些你不熟悉的規則——好習慣是培養出來的,而不是一次性記住的;
  37. 每學到一個C++難點的時候,嘗試着對別人講解這個知識點並讓他理解——你能講清楚才說明你真的理解了;
  38. 記錄下在和別人交流時發現的自己忽視或不理解的知識點;
  39. 請不斷的對自己寫的程序提出更高的要求,哪怕你的程序版本號會變成Version 100.xxx;
  40. 保存好你寫過的所有的程序——那是你最好的積累之一;
  41. 請不要做浮躁的人;
  42. 請熱愛C++。

四、C++頭文件

4.1 傳統C++

#include <assert.h>    設定插入點
#include <ctype.h>    字符處理
#include <errno.h>     定義錯誤碼
#include <float.h>    浮點數處理
#include <fstream.h>   文件輸入/輸出
#include <iomanip.h>    參數化輸入/輸出
#include <iostream.h>   數據流輸入/輸出
#include <limits.h>    定義各種數據類型最值常量
#include <locale.h>    定義本地化函數
#include <math.h>     定義數學函數
#include <stdio.h>    定義輸入/輸出函數
#include <stdlib.h>    定義雜項函數及內存分配函數
#include <string.h>    字符串處理
#include <strstrea.h>   基於數組的輸入/輸出
#include <time.h>     定義關於時間的函數
include <wchar.h>     寬字符處理及輸入/輸出
include <wctype.h>    寬字符分類

4.2 標準 C++

#include <algorithm>     通用算法
#include <bitset>      位集容器
#include <cctype>
#include <cerrno>
#include <clocale>
#include <cmath>
#include <complex>     複數類
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <ctime>
#include <deque>      雙端隊列容器
#include <exception>    異常處理類
#include <fstream>
#include <functional>    定義運算函數(代替運算符)
#include <limits>
#include <list>       線性列表容器
#include <map>       映射容器
#include <iomanip>
#include <ios>      基本輸入/輸出支持
#include <iosfwd>    輸入/輸出系統使用的前置聲明
#include <iostream>
#include <istream>     基本輸入流
#include <ostream>     基本輸出流
#include <queue>       隊列容器
#include <set>       集合容器
#include <sstream>     基於字符串的流
#include <stack>      堆棧容器
#include <stdexcept>    標準異常類
#include <streambuf>   底層輸入/輸出支持
#include <string>     字符串類
#include <utility>     通用模板類
#include <vector>     動態數組容器
#include <cwchar>
#include <cwctype>

4.3 C99增加

#include <complex.h>  複數處理
#include <fenv.h>    浮點環境
#include <inttypes.h>  整數格式轉換
#include <stdbool.h>   布爾環境
#include <stdint.h>   整型環境
#include <tgmath.h>  通用類型數學宏
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章