C++ 對象的內存佈局(上)【轉】

C++ 對象的內存佈局(上)

 

陳皓

http://blog.csdn.net/haoel


 【另:自己學習想多看幾遍就轉載過來,感謝作者,注意版權】 

前言

 

07年12月,我寫了一篇《C++虛函數表解析》的文章,引起了大家的興趣。有很多朋友對我的文章留了言,有鼓勵我的,有批評我的,還有很多問問題的。我在這裏一併對大家的留言表示感謝。這也是我爲什麼再寫一篇續言的原因。因爲,在上一篇文章中,我用了的示例都是非常簡單的,主要是爲了說明一些機理上的問題,也是爲了圖一些表達上方便和簡單。不想,這篇文章成爲了打開C++對象模型內存佈局的一個引子,引發了大家對C++對象的更深層次的討論。當然,我之前的文章還有很多方面沒有涉及,從我個人感覺下來,在談論虛函數表裏,至少有以下這些內容沒有涉及:

1)有成員變量的情況。

2)有重複繼承的情況。

3)有虛擬繼承的情況。

4)有鑽石型虛擬繼承的情況。

 

這些都是我本篇文章需要向大家說明的東西。所以,這篇文章將會是《C++虛函數表解析》的一個續篇,也是一篇高級進階的文章。我希望大家在讀這篇文章之前對C++有一定的基礎和了解,並能先讀我的上一篇文章。因爲這篇文章的深度可能會比較深,而且會比較雜亂,我希望你在讀本篇文章時不會有大腦思維紊亂導致大腦死機的情況。;-)

 

對象的影響因素

 

簡而言之,我們一個類可能會有如下的影響因素:

 

1)成員變量

2)虛函數(產生虛函數表)

3)單一繼承(只繼承於一個類)

4)多重繼承(繼承多個類)

5)重複繼承(繼承的多個父類中其父類有相同的超類)

6)虛擬繼承(使用virtual方式繼承,爲了保證繼承後父類的內存佈局只會存在一份)

上述的東西通常是C++這門語言在語義方面對對象內部的影響因素,當然,還會有編譯器的影響(比如優化),還有字節對齊的影響。在這裏我們都不討論,我們只討論C++語言上的影響。

 

本篇文章着重討論下述幾個情況下的C++對象的內存佈局情況。

 

1)單一的一般繼承(帶成員變量、虛函數、虛函數覆蓋)

2)單一的虛擬繼承(帶成員變量、虛函數、虛函數覆蓋)

3)多重繼承(帶成員變量、虛函數、虛函數覆蓋)

4)重複多重繼承(帶成員變量、虛函數、虛函數覆蓋)

5)鑽石型的虛擬多重繼承(帶成員變量、虛函數、虛函數覆蓋)

 

我們的目標就是,讓事情越來越複雜。

 

知識複習

 

我們簡單地複習一下,我們可以通過對象的地址來取得虛函數表的地址,如:

 

          typedef void(*Fun)(void);

 

            Base b;

 

            Fun pFun = NULL;

 

            cout << "虛函數表地址:" << (int*)(&b) << endl;

            cout << "虛函數表 — 第一個函數地址:" << (int*)*(int*)(&b) << endl;

 

            // Invoke the first virtual function 

            pFun = (Fun)*((int*)*(int*)(&b));

            pFun();

 

我們同樣可以用這種方式來取得整個對象實例的內存佈局。因爲這些東西在內存中都是連續分佈的,我們只需要使用適當的地址偏移量,我們就可以獲得整個內存對象的佈局。

 

本篇文章中的例程或內存佈局主要使用如下編譯器和系統:

1)Windows XP 和 VC++ 2003

2)Cygwin 和 G++ 3.4.4

 

單一的一般繼承

 

下面,我們假設有如下所示的一個繼承關係:

 

 

請注意,在這個繼承關係中,父類,子類,孫子類都有自己的一個成員變量。而了類覆蓋了父類的f()方法,孫子類覆蓋了子類的g_child()及其超類的f()。

 

我們的源程序如下所示:

 

class Parent {

public:

    int iparent;

    Parent ():iparent (10) {}

    virtual void f() { cout << " Parent::f()" << endl; }

    virtual void g() { cout << " Parent::g()" << endl; }

    virtual void h() { cout << " Parent::h()" << endl; }

 

};

 

class Child : public Parent {

public:

    int ichild;

    Child():ichild(100) {}

    virtual void f() { cout << "Child::f()" << endl; }

    virtual void g_child() { cout << "Child::g_child()" << endl; }

    virtual void h_child() { cout << "Child::h_child()" << endl; }

};

 

class GrandChild : public Child{

public:

    int igrandchild;

    GrandChild():igrandchild(1000) {}

    virtual void f() { cout << "GrandChild::f()" << endl; }

    virtual void g_child() { cout << "GrandChild::g_child()" << endl; }

    virtual void h_grandchild() { cout << "GrandChild::h_grandchild()" << endl; }

};

我們使用以下程序作爲測試程序:(下面程序中,我使用了一個int** pVtab 來作爲遍歷對象內存佈局的指針,這樣,我就可以方便地像使用數組一樣來遍歷所有的成員包括其虛函數表了,在後面的程序中,我也是用這樣的方法的,請不必感到奇怪,)

 

    typedef void(*Fun)(void);

    GrandChild gc;

   

 

    int** pVtab = (int**)&gc;

 

    cout << "[0] GrandChild::_vptr->" << endl;

    for (int i=0; (Fun)pVtab[0][i]!=NULL; i++){

                pFun = (Fun)pVtab[0][i];

                cout << "    ["<<i<<"] ";

                pFun();

    }

    cout << "[1] Parent.iparent = " << (int)pVtab[1] << endl;

    cout << "[2] Child.ichild = " << (int)pVtab[2] << endl;

    cout << "[3] GrandChild.igrandchild = " << (int)pVtab[3] << endl;

 

其運行結果如下所示:(在VC++ 2003和G++ 3.4.4下)

 

[0] GrandChild::_vptr->

    [0] GrandChild::f()

    [1] Parent::g()

    [2] Parent::h()

    [3] GrandChild::g_child()

    [4] Child::h1()

    [5] GrandChild::h_grandchild()

[1] Parent.iparent = 10

[2] Child.ichild = 100

[3] GrandChild.igrandchild = 1000

 

使用圖片表示如下:

 

 

 

可見以下幾個方面:

1)虛函數表在最前面的位置。

2)成員變量根據其繼承和聲明順序依次放在後面。

3)在單一的繼承中,被overwrite的虛函數在虛函數表中得到了更新。

 

 

 

 

 

多重繼承

 

下面,再讓我們來看看多重繼承中的情況,假設有下面這樣一個類的繼承關係。注意:子類只overwrite了父類的f()函數,而還有一個是自己的函數(我們這樣做的目的是爲了用g1()作爲一個標記來標明子類的虛函數表)。而且每個類中都有一個自己的成員變量:

 

 

 

我們的類繼承的源代碼如下所示:父類的成員初始爲10,20,30,子類的爲100

 

class Base1 {

public:

    int ibase1;

    Base1():ibase1(10) {}

    virtual void f() { cout << "Base1::f()" << endl; }

    virtual void g() { cout << "Base1::g()" << endl; }

    virtual void h() { cout << "Base1::h()" << endl; }

 

};

 

class Base2 {

public:

    int ibase2;

    Base2():ibase2(20) {}

    virtual void f() { cout << "Base2::f()" << endl; }

    virtual void g() { cout << "Base2::g()" << endl; }

    virtual void h() { cout << "Base2::h()" << endl; }

};

 

class Base3 {

public:

    int ibase3;

    Base3():ibase3(30) {}

    virtual void f() { cout << "Base3::f()" << endl; }

    virtual void g() { cout << "Base3::g()" << endl; }

    virtual void h() { cout << "Base3::h()" << endl; }

};

 

 

class Derive : public Base1, public Base2, public Base3 {

public:

    int iderive;

    Derive():iderive(100) {}

    virtual void f() { cout << "Derive::f()" << endl; }

    virtual void g1() { cout << "Derive::g1()" << endl; }

};

 

我們通過下面的程序來查看子類實例的內存佈局:下面程序中,注意我使用了一個s變量,其中用到了sizof(Base)來找下一個類的偏移量。(因爲我聲明的是int成員,所以是4個字節,所以沒有對齊問題。關於內存的對齊問題,大家可以自行試驗,我在這裏就不多說了)

 

             typedef void(*Fun)(void);

               Derive d;

 

                int** pVtab = (int**)&d;

 

                cout << "[0] Base1::_vptr->" << endl;

                pFun = (Fun)pVtab[0][0];

                cout << "     [0] ";

                pFun();

 

                pFun = (Fun)pVtab[0][1];

                cout << "     [1] ";pFun();

 

                pFun = (Fun)pVtab[0][2];

                cout << "     [2] ";pFun();

 

                pFun = (Fun)pVtab[0][3];

                cout << "     [3] "; pFun();

 

                pFun = (Fun)pVtab[0][4];

                cout << "     [4] "; cout<<pFun<<endl;

 

                cout << "[1] Base1.ibase1 = " << (int)pVtab[1] << endl;

 

 

                int s = sizeof(Base1)/4;

 

                cout << "[" << s << "] Base2::_vptr->"<<endl;

                pFun = (Fun)pVtab[s][0];

                cout << "     [0] "; pFun();

 

                Fun = (Fun)pVtab[s][1];

                cout << "     [1] "; pFun();

 

                pFun = (Fun)pVtab[s][2];

                cout << "     [2] "; pFun();

 

                pFun = (Fun)pVtab[s][3];

                out << "     [3] ";

                cout<<pFun<<endl;

 

                cout << "["<< s+1 <<"] Base2.ibase2 = " << (int)pVtab[s+1] << endl;

 

                s = s + sizeof(Base2)/4;

                cout << "[" << s << "] Base3::_vptr->"<<endl;

                pFun = (Fun)pVtab[s][0];

                cout << "     [0] "; pFun();

 

                pFun = (Fun)pVtab[s][1];

                cout << "     [1] "; pFun();

 

                pFun = (Fun)pVtab[s][2];

                cout << "     [2] "; pFun();

 

                pFun = (Fun)pVtab[s][3];

                 cout << "     [3] ";

                cout<<pFun<<endl;

 

                s++;

                cout << "["<< s <<"] Base3.ibase3 = " << (int)pVtab[s] << endl;

                s++;

                cout << "["<< s <<"] Derive.iderive = " << (int)pVtab[s] << endl;

 

其運行結果如下所示:(在VC++ 2003和G++ 3.4.4下)

[0] Base1::_vptr->

     [0] Derive::f()

     [1] Base1::g()

     [2] Base1::h()

     [3] Driver::g1()

     [4] 00000000      ç 注意:在GCC下,這裏是1

[1] Base1.ibase1 = 10

[2] Base2::_vptr->

     [0] Derive::f()

     [1] Base2::g()

     [2] Base2::h()

     [3] 00000000      ç 注意:在GCC下,這裏是1

[3] Base2.ibase2 = 20

[4] Base3::_vptr->

     [0] Derive::f()

     [1] Base3::g()

     [2] Base3::h()

     [3] 00000000

[5] Base3.ibase3 = 30

[6] Derive.iderive = 100


使用圖片表示是下面這個樣子:

 

 

我們可以看到:

1)  每個父類都有自己的虛表。

2)  子類的成員函數被放到了第一個父類的表中。

3)  內存佈局中,其父類佈局依次按聲明順序排列。

4)  每個父類的虛表中的f()函數都被overwrite成了子類的f()。這樣做就是爲了解決不同的父類類型的指針指向同一個子類實例,而能夠調用到實際的函數。


(轉載時請註明作者和出處。未經許可,請勿用於商業用途)

 

更多文章請訪問我的Blog: http://blog.csdn.net/haoel


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章