多態和虛表

多態

多態的這個概念稍微有點模糊,如果想在一開始就想用清晰用語言描述它,讓讀者能夠明白,似乎不太現實,所以我們先看如下代碼:

//例程1 
#include <iostream>      
using namespace std;    
    
class Vehicle 
{    
public:    
     Vehicle(float speed,int total) 
     { 
         Vehicle::speed=speed; 
         Vehicle::total=total; 
     } 
    void ShowMember() 
     { 
        cout<<speed<<"|"<<total<<endl; 
     } 
protected:    
    float speed; 
    int total; 
};    
class Car:public Vehicle    
{    
public:    
     Car(int aird,float speed,int total):Vehicle(speed,total)    
     {    
         Car::aird=aird;    
     } 
   void ShowMember()

     { 
        cout<<speed<<"|"<<total<<"|"<<aird<<endl; 
     } 
protected:    
    int aird; 
};    

void main()    
{    
     Vehicle a(120,4); 
     a.ShowMember(); 
     Car b(180,110,4); 
     b.ShowMember(); 
    cin.get(); 
}

   在c++中是允許派生類重載基類成員函數的,對於類的重載來說,明確的,不同類的對象,調用其類的成員函數的時候,系統是知道如何找到其類的同名成員,上面代碼中的a.ShowMember();,即調用的是Vehicle::ShowMember(),b.ShowMember();,即調用的是 Car::ShowMemeber();。

但是在實際工作中,很可能會碰到對象所屬類不清的情況,下面我們來看一下派生類成員作爲函數參數傳遞的例子,代碼如下:

//例程2 
#include <iostream>      
using namespace std;    
    
class Vehicle 
{    
public:    
     Vehicle(float speed,int total) 
     { 
         Vehicle::speed=speed; 
         Vehicle::total=total; 
     } 
    void ShowMember() 
     { 
        cout<<speed<<"|"<<total<<endl; 
     } 
protected:    
    float speed; 
    int total; 
};    
class Car:public Vehicle    
{    
public:    
     Car(int aird,float speed,int total):Vehicle(speed,total)    
     {    
         Car::aird=aird;    
     } 
    void ShowMember() 
     { 
        cout<<speed<<"|"<<total<<"|"<<aird<<endl; 
     } 
protected:    
    int aird; 
};    

void test(Vehicle &temp) 

     temp.ShowMember(); 


void main()    

     Vehicle a(120,4); 
     Car b(180,110,4); 
     test(a); 
     test(b); 
    cin.get(); 
}

   例子中,對象a與b分辨是基類和派生類的對象,而函數test的形參卻只是Vehicle類的引用,按照類繼承的特點,系統把Car類對象看做是一個 Vehicle類對象,因爲Car類的覆蓋範圍包含Vehicle類,所以test函數的定義並沒有錯誤,我們想利用test函數達到的目的是,傳遞不同類對象的引用,分別調用不同類的,重載了的,ShowMember成員函數,但是程序的運行結果卻出乎人們的意料,系統分不清楚傳遞過來的基類對象還是派生類對象,無論是基類對象還是派生類對象調用的都是基類的ShowMember成員函數。

爲了要解決上述不能正確分辨對象類型的問題,c++提供了一種叫做多態性(polymorphism)的技術來解決問題,對於例程序1,這種能夠在編譯時就能夠確定哪個重載的成員函數被調用的情況被稱做先期聯編(early binding),而在系統能夠在運行時,能夠根據其類型確定調用哪個重載的成員函數的能力,稱爲多態性,或叫滯後聯編(late binding),下面我們要看的例程3,就是滯後聯編,滯後聯編正是解決多態問題的方法。 

代碼如下:

//例程3 
#include <iostream>      
using namespace std;    
    
class Vehicle 
{    
public:    
     Vehicle(float speed,int total) 
     { 
         Vehicle::speed = speed; 
         Vehicle::total = total; 
     } 
    virtual void ShowMember()//虛函數 
     { 
        cout<<speed<<"|"<<total<<endl; 
     } 
protected:    
    float speed; 
    int total; 
};    
class Car:public Vehicle    
{    
public:    
     Car(int aird,float speed,int total):Vehicle(speed,total)    
     {    
         Car::aird = aird;    
     } 
    virtual void ShowMember()//虛函數,在派生類中,由於繼承的關係,這裏的virtual也可以不加 
     { 
        cout<<speed<<"|"<<total<<"|"<<aird<<endl; 
     } 
public:    
    int aird; 
}; 

void test(Vehicle &temp) 

     temp.ShowMember(); 


int main()    
{    
     Vehicle a(120,4); 
     Car b(180,110,4); 
     test(a); 
     test(b); 
    cin.get(); 
}

  多態特性的工作依賴虛函數的定義,在需要解決多態問題的重載成員函數前,加上virtual關鍵字,那麼該成員函數就變成了虛函數,從上例代碼運行的結果看,系統成功的分辨出了對象的真實類型,成功的調用了各自的重載成員函數。

  多態特性讓程序員省去了細節的考慮,提高了開發效率,使代碼大大的簡化,當然虛函數的定義也是有缺陷的,因爲多態特性增加了一些數據存儲和執行指令的開銷,所以能不用多態最好不用

虛函數的定義要遵循以下重要規則: 

  1.如果虛函數在基類與派生類中出現,僅僅是名字相同,而形式參數不同,或者是返回類型不同,那麼即使加上了virtual關鍵字,也是不會進行滯後聯編的。 

2.只有類的成員函數才能說明爲虛函數,因爲虛函數僅適合用與有繼承關係的類對象,所以普通函數不能說明爲虛函數。 

3.靜態成員函數不能是虛函數,因爲靜態成員函數的特點是不受限制於某個對象。 

4.內聯(inline)函數不能是虛函數,因爲內聯函數不能在運行中動態確定位置。即使虛函數在類的內部定義,但是在編譯的時候系統仍然將它看做是非內聯的。 

5.構造函數不能是虛函數,因爲構造的時候,對象還是一片位定型的空間,只有構造完成後,對象纔是具體類的實例。 

6.析構函數可以是虛函數,而且通常聲名爲虛函數。
 

說明一下,雖然我們說使用虛函數會降低效率,但是在處理器速度越來越快的今天,將一個類中的所有成員函數都定義成爲virtual總是有好處的,它除了會增加一些額外的開銷是沒有其它壞處的,對於保證類的封裝特性是有好處的。

  對於上面虛函數使用的重要規則6,我們有必要用實例說明一下,爲什麼具備多態特性的類的析構函數,有必要聲明爲virtual。 

代碼如下:

#include <iostream>      
using namespace std;    
    
class Vehicle 
{    
public:   
     Vehicle(float speed,int total) 
     { 
         Vehicle::speed=speed; 
         Vehicle::total=total; 
     } 
    virtual void ShowMember() 
     { 
        cout<<speed<<"|"<<total<<endl; 
     } 
    virtual ~Vehicle() 
     { 
        cout<<"載入Vehicle基類析構函數"<<endl; 
        cin.get(); 
     } 
protected:    
    float speed; 
    int total; 
};    
class Car:public Vehicle    
{    
public:    
     Car(int aird,float speed,int total):Vehicle(speed,total)    
     {    
         Car::aird=aird;    
     } 
    virtual void ShowMember() 
     { 
        cout<<speed<<"|"<<total<<"|"<<aird<<endl; 
     } 
    virtual ~Car() 
     { 
        cout<<"載入Car派生類析構函數"<<endl; 
        cin.get(); 
     } 
protected:    
    int aird; 
};    

void test(Vehicle &temp) 

     temp.ShowMember(); 

void DelPN(Vehicle *temp) 

    delete temp; 

void main() 
{    
     Car *a=new Car(100,1,1); 
     a->ShowMember(); 
     DelPN(a); 
    cin.get(); 
}

   從上例代碼的運行結果來看,當調用DelPN(a);後,在析構的時候,系統成功的確定了先調用Car類的析構函數,而如果將析構函數的virtual 修飾去掉,再觀察結果,會發現析構的時候,始終只調用了基類的析構函數,由此我們發現,多態的特性的virtual修飾,不單單對基類和派生類的普通成員函數有必要,而且對於基類和派生類的析構函數同樣重要。

詳解虛表

C++中的虛函數的作用主要是實現了多態的機制。關於多態,簡而言之就是用父類型別的指針指向其子類的實例,然後通過父類的指針調用實際子類的成員函數。這種技術可以讓父類的指針有“多種形態”,這是一種泛型技術所謂泛型技術,說白了就是試圖使用不變的代碼來實現可變的算法。比如:模板技術,RTTI技術,虛函數技術,要麼是試圖做到在編譯時決議,要麼試圖做到運行時決議。

關於虛函數的使用方法,我在這裏不做過多的闡述。大家可以看看相關的C++的書籍。在這篇文章中,我只想從虛函數的實現機制上面爲大家一個清晰的剖析。

當然,相同的文章在網上也出現過一些了,但我總感覺這些文章不是很容易閱讀,大段大段的代碼,沒有圖片,沒有詳細的說明,沒有比較,沒有舉一反三。不利於學習和閱讀,所以這是我想寫下這篇文章的原因。也希望大家多給我提意見。

言歸正傳,讓我們一起進入虛函數的世界。

虛函數表

對C++ 瞭解的人都應該知道虛函數(Virtual Function)是通過一張虛函數表(Virtual Table)來實現的。簡稱爲V-Table。 在這個表中,主要是一個類的虛函數的地址表,這張表解決了繼承、覆蓋的問題,保證其容真實反應實際的函數。這樣,在有虛函數的類的實例中這個表被分配在了這個實例的內存中,所以,當我們用父類的指針來操作一個子類的時候,這張虛函數表就顯得由爲重要了,它就像一個地圖一樣,指明瞭實際所應該調用的函數。

這裏我們着重看一下這張虛函數表。在C++的標準規格說明書中說到,編譯器必需要保證虛函數表的指針存在於對象實例中最前面的位置(這是爲了保證正確取到虛函數的偏移量)。 這意味着我們通過對象實例的地址得到這張虛函數表,然後就可以遍歷其中函數指針,並調用相應的函數。

聽我扯了那麼多,我可以感覺出來你現在可能比以前更加暈頭轉向了。 沒關係,下面就是實際的例子,相信聰明的你一看就明白了。

假設我們有這樣的一個類:

class Base {

public:

virtual void f() { cout << "Base::f" << endl; }

virtual void g() { cout << "Base::g" << endl; }

virtual void h() { cout << "Base::h" << endl; }

};

按照上面的說法,我們可以通過Base的實例來得到虛函數表。 下面是實際例程:

typedef void(*Fun)(void);

Base b;

Fun pFun = NULL;

cout << "虛函數表地址:" << (int*)(&b) << endl;

cout << "虛函數表 — 第一個函數地址:" << (int*)*(int*)(&b) << endl;

// Invoke the first virtual function

pFun = (Fun)*((int*)*(int*)(&b));

pFun();

實際運行經果如下:(Windows XP+VS2003, Linux 2.6.22 + GCC 4.1.3)

虛函數表地址:0012FED4

虛函數表 — 第一個函數地址:0044F148

Base::f

通過這個示例,我們可以看到,我們可以通過強行把&b轉成int *,取得虛函數表的地址,然後,再次取址就可以得到第一個虛函數的地址了,也就是Base::f(),這在上面的程序中得到了驗證(把int* 強制轉成了函數指針)。通過這個示例,我們就可以知道如果要調用Base::g()和Base::h(),其代碼如下:

(Fun)*((int*)*(int*)(&b)+0); // Base::f()

(Fun)*((int*)*(int*)(&b)+1); // Base::g()

(Fun)*((int*)*(int*)(&b)+2); // Base::h()

 



注意:在上面這個圖中,我在虛函數表的最後多加了一個結點,這是虛函數表的結束結點,就像字符串的結束符“/0”一樣,其標誌了虛函數表的結束。這個結束標誌的值在不同的編譯器下是不同的。在WinXP+VS2003下,這個值是NULL。而在Ubuntu 7.10 + Linux 2.6.22 + GCC 4.1.3下,這個值是如果1,表示還有下一個虛函數表,如果值是0,表示是最後一個虛函數表。

下面,我將分別說明“無覆蓋”和“有覆蓋”時的虛函數表的樣子。沒有覆蓋父類的虛函數是毫無意義的。我之所以要講述沒有覆蓋的情況,主要目的是爲了給一個對比。在比較之下,我們可以更加清楚地知道其內部的具體實現。

一般繼承(無虛函數覆蓋)

下面,再讓我們來看看繼承時的虛函數表是什麼樣的。假設有如下所示的一個繼承關係:



請注意,在這個繼承關係中,子類沒有重載任何父類的函數。那麼,在派生類的實例中,其虛函數表如下所示:

對於實例:Derive d; 的虛函數表如下:

我們可以看到下面幾點:

1)虛函數按照其聲明順序放於表中。

2)父類的虛函數在子類的虛函數前面。

我相信聰明的你一定可以參考前面的那個程序,來編寫一段程序來驗證。

一般繼承(有虛函數覆蓋)

覆蓋父類的虛函數是很顯然的事情,不然,虛函數就變得毫無意義。下面,我們來看一下,如果子類中有虛函數重載了父類的虛函數,會是一個什麼樣子?假設,我們有下面這樣的一個繼承關係。

爲了讓大家看到被繼承過後的效果,在這個類的設計中,我只覆蓋了父類的一個函數:f()。那麼,對於派生類的實例,其虛函數表會是下面的一個樣子:

 

 

我們從表中可以看到下面幾點,

1)覆蓋的f()函數被放到了虛表中原來父類虛函數的位置。

2)沒有被覆蓋的函數依舊。

這樣,我們就可以看到對於下面這樣的程序,

Base *b = new Derive();

b->f();

由b所指的內存中的虛函數表的f()的位置已經被Derive::f()函數地址所取代,於是在實際調用發生時,是Derive::f()被調用了。這就實現了多態。

(原來是這麼一回事!!!)注意上面那句,是相應的函數被取代,而不是被覆蓋的函數就會被放到第一位的位置。

深入淺出MFC:
1.每一個內涵虛函數的類,編譯器都爲它做出一個虛擬函數表,表中的每一個元素都指向一個虛函數的地址。
此外,編譯器當然也會爲類表加上一項成員函數,是一個指向該虛擬函數表的指針(常被稱爲vptr),每一個由此類別派生出來的類,都有這麼一個vptr。
2.虛表以及這種間接呼叫方式。虛表的內容是依據類別中的虛函數聲明次序--填入函數指針。派生類別會繼承基礎類別的虛表(以及所有其他可以繼承的成員),當我們在派生類中改寫虛函數時,虛表就受了影響;表中的元素所指的函數地址將不再是基類的函數地址,而是派生類的函數地址。

當然,這裏面所說的都是派生類繼承了基類的虛表(具體點說也不能說是繼承了虛表,而是基類虛表中有的,在派生類中葉有,並對派生類自己的虛函數進行了擴展),但是這是在VC環境或VS環境下的結果,對於不通的編譯器,處理方式也不一樣,如果是G++可能就不會繼承。如:http://zhidao.baidu.com/question/129641932.html

 

多重繼承(無虛函數覆蓋)

下面,再讓我們來看看多重繼承中的情況,假設有下面這樣一個類的繼承關係。注意:子類並沒有覆蓋父類的函數。

對於子類實例中的虛函數表,是下面這個樣子:

 

我們可以看到:

1) 每個父類都有自己的虛表。

2) 子類的成員函數被放到了第一個父類的表中。(所謂的第一個父類是按照聲明順序來判斷的)

這樣做就是爲了解決不同的父類類型的指針指向同一個子類實例,而能夠調用到實際的函數。

多重繼承(有虛函數覆蓋)

下面我們再來看看,如果發生虛函數覆蓋的情況。

下圖中,我們在子類中覆蓋了父類的f()函數。

下面是對於子類實例中的虛函數表的圖:

我們可以看見,三個父類虛函數表中的f()的位置被替換成了子類的函數指針。這樣,我們就可以任一靜態類型的父類來指向子類,並調用子類的f()了。如:

Derive d;

Base1 *b1 = &d;

Base2 *b2 = &d;

Base3 *b3 = &d;

b1->f(); //Derive::f()

b2->f(); //Derive::f()

b3->f(); //Derive::f()

b1->g(); //Base1::g()

b2->g(); //Base2::g()

b3->g(); //Base3::g()

安全性

每次寫C++的文章,總免不了要批判一下C++。這篇文章也不例外。通過上面的講述,相信我們對虛函數表有一個比較細緻的瞭解了。水可載舟,亦可覆舟。下面,讓我們來看看我們可以用虛函數表來乾點什麼壞事吧。

一、通過父類型的指針訪問子類自己的虛函數

我們知道,子類沒有重載父類的虛函數是一件毫無意義的事情。因爲多態也是要基於函數重載的。雖然在上面的圖中我們可以看到Base1的虛表中有Derive的虛函數,但我們根本不可能使用下面的語句來調用子類的自有虛函數:

Base1 *b1 = new Derive();

b1->f1(); //編譯出錯

任何妄圖使用父類指針想調用子類中的未覆蓋父類的成員函數的行爲都會被編譯器視爲非法,所以,這樣的程序根本無法編譯通過。但在運行時,我們可以通過指針的方式訪問虛函數表來達到違反C++語義的行爲。

二、訪問non-public的虛函數

另外,如果父類的虛函數是private或是protected的,但這些非public的虛函數同樣會存在於虛函數表中,所以,我們同樣可以使用訪問虛函數表的方式來訪問這些non-public的虛函數,這是很容易做到的。

如:

class Base {

private:

virtual void f() { cout << "Base::f" << endl; }

};

class Derive : public Base{

};

typedef void(*Fun)(void);

void main() {

Derive d;

Fun pFun = (Fun)*((int*)*(int*)(&d)+0);

pFun();

}

結束語

C++這門語言是一門Magic的語言,對於程序員來說,我們似乎永遠摸不清楚這門語言揹着我們在幹了什麼。需要熟悉這門語言,我們就必需要了解C++裏面的那些東西,需要去了解C++中那些危險的東西。不然,這是一種搬起石頭砸自己腳的編程語言。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章