STL與泛型編程

STL與泛型編程

1 STL基本概念(參考晨光《C++ STL輕鬆導學》)
 
       STL(Standard Template Library),即標準模板庫,是一個具有工業強度的,高效的C++程序庫。它被容納於C++標準程序庫(C++ Standard Library)中,是ANSI/ISO C++標準中最新的也是極具革命性的一部分。該庫包含了諸多在計算機科學領域裏所常用的基本數據結構基本算法。爲廣大C++程序員們提供了一個可擴展的應用框架,高度體現了軟件的可複用性。這種現象有些類似於Microsoft Visual C++中的MFC(Microsoft Foundation Class Library),或者是Borland C++ Builder中的VCL(Visual Component Library)。

      從邏輯層次來看,在STL中體現了泛型化程序設計的思想(generic programming),引入了諸多新的概念,比如像需求(requirements),概念(concept),模型(model),容器(container),算法(algorithmn),迭代子(iterator)等。與OOP(object-oriented programming)中的多態(polymorphism)一樣,泛型也是一種軟件的複用技術。

      從實現層次看,整個STL是以一種類型參數化(type parameterized)的方式實現的,這種方式基於一個在早先C++標準中沒有出現的語言特性--模板(template)。如果查閱任何一個版本的STL源代碼,你就會發現,模板作爲構成整個STL的基石是一件千真萬確的事情。除此之外,還有許多C++的新特性爲STL的實現提供了方便。

 

2 STL和C++

      沒有C++語言就沒有STL,這麼說毫不爲過。一般而言,STL作爲一個泛型化的數據結構和算法庫,並不牽涉具體語言(當然,在C++裏,它被稱爲STL)。也就是說,如果條件允許,用其他語言也可以實現之。這裏所說的條件,主要是指類似於"模板"這樣的語法機制。但是,爲什麼最終還是C++幸運的承擔了這個歷史性任務呢?原因不僅在於前述那個條件,還在於C++在某些方面所表現出來的優越特性,比如:高效而靈活的指針。但是如果把C++作爲一種OOP(Object-Oriented Programming,面向對象程序設計)語言來看待的話(事實上我們一般都是這麼認爲的,不是嗎?),其功能強大的繼承機制卻沒有給STL的實現幫上多大的忙。在STL的源代碼裏,並沒有太多太複雜的繼承關係。繼承的思想,甚而面向對象的思想,還不足以實現類似STL這樣的泛型庫。C++只有在引入了"模板"之後,才直接導致了STL的誕生。這也正是爲什麼,用其他比C++更純的面嚮對象語言無法實現泛型思想的一個重要原因。當然,事情總是在變化之中,像Java在這方面,就是一個很好的例子,jdk1.4中已經加入了泛型的特性。

      此外,STL對於C++的發展,尤其是模板機制,也起到了促進作用。比如:模板函數的偏特化(template function partial specialization),它被用於在特定應用場合,爲一般模板函數提供一系列特殊化版本。這一特性是繼STL被ANSI/ISO C++標準委員會通過之後,在Bjarne和Stepanov共同商討之下並由Bjarne向委員會提出建議的,最終該項建議被通過。這使得STL中的一些算法在處理特殊情形時可以選擇非一般化的方式,從而保證了執行的效率。

 

3 STL和C++標準函數庫

      STL是最新的C++標準函數庫中的一個子集,佔據了整個庫的大約80%的分量。而作爲在實現STL過程中扮演關鍵角色的模板則充斥了幾乎整個C++標準函數庫。在這裏,我們有必要看一看C++標準函數庫裏包含了哪些內容,其中又有哪些是屬於標準模板庫(即STL)的。

      C++標準函數庫爲C++程序員們提供了一個可擴展的基礎性框架。我們從中可以獲得極大的便利,同時也可以通過繼承現有類,自己編制符合接口規範的容器、算法、迭代子等方式對之進行擴展。它大致包含了如下幾個組件

C標準函數庫,基本保持了與原有C語言程序庫的良好兼容,儘管有些微變化。人們總會忍不住留戀過去的美好歲月,如果你曾經是一個C程序員,對這一點一定體會頗深。或許有一點會讓你覺得奇怪,那就是在C++標準庫中存在兩套C的函數庫,一套是帶有.h擴展名的(比如<stdio.h>),而另一套則沒有(比如<cstdio>)。它們確實沒有太大的不同。

語言支持(language support)部分,包含了一些標準類型的定義以及其他特性的定義,這些內容,被用於標準庫的其他地方或是具體的應用程序中。

診斷(diagnostics)部分,提供了用於程序診斷和報錯的功能,包含了異常處理(exception handling),斷言(assertions),錯誤代碼(error number codes)三種方式。

通用工具(general utilities)部分,這部分內容爲C++標準庫的其他部分提供支持,當然你也可以在自己的程序中調用相應功能。比如:動態內存管理工具,日期/時間處理工具。記住,這裏的內容也已經被泛化了(即採用了模板機制)。

字符串(string)部分,用來代表和處理文本。它提供了足夠豐富的功能。事實上,文本是一個string對象,它可以被看作是一個字符序列,字符類型可能是char,或者wchar_t等等。string可以被轉換成char*類型,這樣便可以和以前所寫的C/C++代碼和平共處了。因爲那時侯除了char*,沒有別的。

國際化(internationalization)部分,作爲OOP特性之一的封裝機制在這裏扮演着消除文化和地域差異的角色,採用locale和facet可以爲程序提供衆多國際化支持,包括對各種字符集的支持,日期和時間的表示,數值和貨幣的處理等等。畢竟,在中國和在美國,人們表示日期的習慣是不同的。

容器(containers)部分,STL的一個重要組成部分,涵蓋了許多數據結構,比如前面曾經提到的鏈表,還有:vector(類似於大小可動態增加的數組)、queue(隊列)、stack(堆棧)……。string也可以看作是一個容器,適用於容器的方法同樣也適用於string。現在你可以輕鬆的完成數據結構課程的家庭作業了。

算法(algorithms)部分,STL的一個重要組成部分,包含了大約70個通用算法,用於操控各種容器,同時也可以操控內建數組。比如:find用於在容器中查找等於某個特定值的元素,for_each用於將某個函數應用到容器中的各個元素上,sort用於對容器中的元素排序。所有這些操作都是在保證執行效率的前提下進行的,所以,如果在你使用了這些算法之後程序變得效率底下,首先一定不要懷疑這些算法本身,仔細檢查一下程序的其他地方。

迭代器(iterators)部分,STL的一個重要組成部分,如果沒有迭代器的撮合,容器和算法便無法結合的如此完美。事實上,每個容器都有自己的迭代器,只有容器自己才知道如何訪問自己的元素。它有點像指針,算法通過迭代器來定位和操控容器中的元素。

數值(numerics)部分,包含了一些數學運算功能,提供了複數運算的支持。

輸入/輸出(input/output)部分,就是經過模板化了的原有標準庫中的iostream部分,它提供了對C++程序輸入輸出的基本支持。在功能上保持了與原有iostream的兼容,並且增加了異常處理的機制,並支持國際化(internationalization)。

總體上,在C++標準函數庫中,STL主要包含了容器、算法、迭代器。string也可以算做是STL的一部分。

 

4 STL與GP,GP與OOP

      正如前面所提到的,在STL的背後蘊含着泛型化程序設計(GP)的思想,在這種思想裏,大部分基本算法被抽象,被泛化,獨立於與之對應的數據結構,用於以相同或相近的方式處理各種不同情形。這一思想和麪向對象的程序設計思想(OOP)不盡相同,因爲,在OOP中更注重的是對數據的抽象,即所謂抽象數據類型(Abstract Data Type),而算法則通常被附屬於數據類型之中。幾乎所有的事情都可以被看作類或者對象(即類的實例),通常,我們所看到的算法被作爲成員函數(member function)包含在類(class)中,類與類之間則構成了錯綜複雜的繼承體系。

      儘管在象C++這樣的程序設計語言中,你還可以用全局函數來表示算法,但是在類似於Java這樣的純面向對象的語言中,全局函數已經被"勒令禁止"了。因此,用Java來模擬GP思想是頗爲困難的。Alexander Stepanove也曾用基於OOP的語言嘗試過實現GP思想,但是效果並不好,包括沒有引入模板之前的C++語言。站在巨人的肩膀上,我們可以得出這樣的結論,在OOP中所體現的思想與GP的思想確實是相異的。C++並不是一種純面向對象的程序設計語言,它的絕妙之處,就在於既滿足了OOP,又成全了GP。對於後者,模板立下了汗馬功勞。另外,需要指出的是,儘管GP和OOP有諸多不同,但這種不同還不至於到"水火不容"的地步。並且,在實際運用的時候,兩者的結合使用往往可以使問題的解決更爲有效。作爲GP思想實例的STL本身便是一個很好的範例,如果沒有繼承,不知道STL會是什麼樣子,似乎沒有人做過這樣的試驗。

 

5 例程(分別用傳統C++,STL風格的C++實現)

(1)傳統C++實現

// name:example2_1.cpp
// alias:Rubish

#include <stdlib.h>
#include <iostream.h>

int compare(const void *arg1, const void *arg2);

void main(void)
{
const int max_size = 10; // 數組允許元素的最大個數
int num[max_size]; // 整型數組

// 從標準輸入設備讀入整數,同時累計輸入個數,
// 直到輸入的是非整型數據爲止
int n;
for (n = 0; cin >> num[n]; n ++);

// C標準庫中的快速排序(quick-sort)函數
qsort(num, n, sizeof(int), compare);

// 將排序結果輸出到標準輸出設備
for (int i = 0; i < n; i ++)
cout << num[i] << "/n";
}

// 比較兩個數的大小,
// 如果*(int *)arg1比*(int *)arg2小,則返回-1
// 如果*(int *)arg1比*(int *)arg2大,則返回1
// 如果*(int *)arg1等於*(int *)arg2,則返回0
int compare(const void *arg1, const void *arg2)
{
return (*(int *)arg1 < *(int *)arg2) ? -1 :
(*(int *)arg1 > *(int *)arg2) ? 1 : 0;
}

這是一個和STL沒有絲毫關係的傳統風格的C++程序。因爲程序的註釋已經很詳盡了,所以不需要再做更多的解釋。總的說來,這個程序看起來並不十分複雜(本來就沒有太多功能)。只是,那個compare函數,看起來有點費勁。指向它的函數指針被作爲最後一個實參傳入qsort函數,qsort是C程序庫stdlib.h中的一個函數。以下是qsort的函數原型:

 

void qsort(void *base, size_t num, size_t width, 
          int (__cdecl *compare )(const void *elem1, const void *elem2 ) );
	 

 

看起來有點令人作嘔,尤其是最後一個參數。大概的意思是,第一個參數指明瞭要排序的數組(比如:程序中的num),第二個參數給出了數組的大小(qsort沒有足夠的智力預知你傳給它的數組的實際大小),第三個參數給出了數組中每個元素以字節爲單位的大小。最後那個長長的傢伙,給出了排序時比較元素的方式(還是因爲qsort的智商問題)。

(2)STL風格的C++實現

// name:example2_2.cpp
// alias:The first STL program

#include <iostream>
#include <vector>
#include <algorithm>

using namespace std;

void main(void)
{
vector<int> num; // STL中的vector容器
int element;

// 從標準輸入設備讀入整數,
// 直到輸入的是非整型數據爲止
while (cin >> element)
num.push_back(element);

// STL中的排序算法
sort(num.begin(), num.end());

// 將排序結果輸出到標準輸出設備
for (int i = 0; i < num.size(); i ++)
cout << num[i] << "/n";
}

sort是STL中的標準算法,用來對容器中的元素進行排序。它需要兩個參數用來決定容器中哪個範圍內的元素可以用來排序。這裏用到了vector的另兩個類屬成員函數。begin()用以指向vector的首端,而end()則指向vector的末端。這裏有兩個問題,begin()和end()的返回值是什麼?這涉及到STL的另一個重要部件--迭代器(Iterator),不過這裏並不需要對它做詳細瞭解。你只需要把它當作是一個指針就可以了,一個指向整型數據的指針。相應的sort函數聲明也可以看作是void sort(int* first, int* last),儘管這實際上很不精確。另一個問題是和end()函數有關,儘管前面說它的返回值指向vector的末端,但這種說法不能算正確。事實上,它的返回值所指向的是vector中最末端元素的後面一個位置,即所謂pass-the-end value。這聽起來有點費解,不過不必在意,這裏只是稍帶一提。總的來說,sort函數所做的事情是對那個準整型數組中的元素進行排序,一如第一個程序中的那個qsort,不過比起qsort來,sort似乎要簡單了許多。

這個程序的主要部分改用了STL的部件,看起來要比第一個程序簡潔一點,你已經找不到那個討厭的compare函數了。程序的運行結果和前面和前面的大致差不多,並且這個程序是足夠健壯的。

(3)唯美主義的STL風格實現(對(2)的改進)

// name:example2_3.cpp
// alias:aesthetic version

#include <iostream>
#include <vector>
#include <algorithm>
#include <iterator>

using namespace std;

void main(void)
{
typedef vector<int>                                   int_vector;
typedef istream_iterator<int>                      istream_itr;
typedef ostream_iterator<int>                     ostream_itr;
typedef back_insert_iterator< int_vector > back_ins_itr;

// STL中的vector容器
int_vector num;

// 從標準輸入設備讀入整數,
// 直到輸入的是非整型數據爲止
copy(istream_itr(cin), istream_itr(), back_ins_itr(num));

// STL中的排序算法
sort(num.begin(), num.end());

// 將排序結果輸出到標準輸出設備
copy(num.begin(), num.end(), ostream_itr(cout, "/n"));
}

在這個程序裏幾乎每行代碼都是和STL有關的(除了main和那對花括號,當然還有註釋),並且它包含了STL中幾乎所有的各大部件(容器container,迭代器iterator, 算法algorithm, 適配器adaptor),唯一的遺憾是少了函數對象(functor)的身影。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章