引用的本質是什麼

在大學的時候,教材裏這麼說的“引用是個別名...引用作爲目標的別名而使用...引用不是值不佔存儲空間...引用只有聲明,沒有定義...”
那麼,引用到底佔不佔內存空間,引用的本質是什麼?

下面舉個例子:
int a = 10;
int &b = a;

這裏,顯然,b是一個引用。
語句“int a = 10;”,在內存中申請了一個int型變量,32位機中佔4個字節,那麼變量名a放哪裏了呢,有些人可能會有這個疑問。
其實a代表的是一個內存地址,you know,計算機訪問內存中的數據,全部是通過地址進行訪問(這個結論你可以從《彙編》的尋址方式中得出)。在編譯器將你的代碼生成目標文件時,它會用這個地址替代所有的a,因此目標文件中也就沒有變量名a了,所以,變量名a不會佔用內存也就理所當然了。
那麼,引用 b會不會佔內存空間呢?由於受大學課本的影響(引用b只是a的別名,b其實就是a本身),我很自然的會想到,b跟a一樣,在編譯後,所有的b也都用a的這個地址去替代,所以b也不會佔用任何內存空間。
前段時間,這個問題在快速入門羣和高級專業羣中各位朋友討論了一下,大家也衆說紛紜。在網上也搜到很多帖子,說引用只是一個別名,它不會佔用空間。
BUT,與各位高手的交流,查看衆多網站,最後得出的結論是:   引用的本質是指針,而且是常量指針,佔用4個字節的空間
也就是說,“int &b = a;”會開闢一塊4個字節的空間,用於存放那個地址,當然,變量名b不會佔用空間。
如果你聽糊塗了,沒關係,記住一條:引用b,本質就是一個常量指針(當然使用時不同)


下面是網絡上比較權威的說法;另外,還有都史用於驗證引用佔內存的實例。如果大家有什麼異議,本人希望與大家多多交流。

探索c++的底層機制


在看這篇文章之前,請你先要明白一點:那就是c++爲我們所提供的各種存取控制僅僅是在編譯階段給我們的限制,也就是說是編譯器確保了你在完成任務之前的正確行爲,如果你的行爲不正確,那麼你休想構造出任何可執行程序來。但如果真正到了產生可執行代碼階段,無論是c,c++,還是pascal,大家都一樣,你認爲c和c++編譯器產生的機器代碼會有所不同嗎,你認爲c++產生的機器代碼會有訪問限制嗎?那麼你錯了。什麼const,private,統統沒有(const變量或許會放入只讀數據段),它不會再給你任何的限制,你可以利用一切內存修改工具或者是自己寫一個程序對某一進程空間的某一變量進行修改,不管它在你的印象中是private,還是public,對於此時的你來說都一樣,想怎樣便怎樣。另外,你也不要爲c++所提供的什麼晚期捆綁等機制大呼神奇,它也僅僅是在所產生的代碼中多加了幾條而已,它遠沒有你想象的那麼智能,所有的工作都是編譯器幫你完成,真正到了執行的時候,計算機會完全按照編譯器產生的代碼一絲不苟的執行。你明白我在說什麼嗎?對了,如果你從前接觸過彙編,只要你反彙編一段c++代碼,你就會說:原來是這麼回事呀,c++只不過是把我們的問題進行了更高層次的抽象,但只要你解開面紗,回到問題的本源,一切都將變得不再神祕……
(以下的反彙編代碼均來自visial c++ 7.0) 
一.讓我們從變量開始-----並非你想象的那麼簡單
變量是什麼,變量就是一個在程序執行過程中可以改變的量。換一個角度,變量是一塊內存區域的名字,它就代表這塊內存區域,當我們對變量進行修改的時候,會引起內存區域中內容的改變。但是你若是學習過彙編或是計算機組成原理,那麼你就會清楚對於一塊內存區域來說,根本就不存在什麼名字,它所僅有的標誌就是他的地址,因此我們若想修改一塊內存區域的內容,只有知道他的地址方能實現。看來所謂的變量一說只不過是編譯器給我們進行的一種抽象,讓我們不必去了解更多的細節,降低我們的思維跨度而已。例如下面這條語句:
int a=10;
按照我們的思維習慣來講,就是“存在一個變量a,它的值是10”,一切都顯得那麼的自然。我們不必去在乎什麼所謂的地址以及其他的一些細節。然而在這條語句的底層實現中,a已經不能算是一個變量了,它僅僅是一個標記,代表一個地址的標記:
mov dword ptr[a],0Ah;
怎麼樣,這條語句不像上面那條易於接受吧,因爲它需要了解更多的細節,你幾乎不能得到編譯器的任何幫助,一切思維上的跨越必須由你自己完成。這條語句應該解釋爲“把10寫入以a爲地址的內存區域”。你說什麼?a有些像指針?對,的確像,但還不是,只不過他們的過程似乎是類似的。這裏所說的跨越實際上就是從一個現實問題到具體地址以及內存區域的跨越。
二.引用:你可以擁有引用,但編譯器僅擁有指針(地址)
看過了第一條,你一定對編譯器的工作有了一定的瞭解,實際上編譯器就是程序員與底層之間的一個轉換層,它把一個高級語言代碼轉換爲低級語言代碼,一個編譯器完成的轉換跨度越大,那麼它也就會越複雜,因爲程序員的工作都由他代爲完成了。C++編譯器必然比彙編編譯器複雜就是這個道理。如果我問你引用和指針是一樣的嗎?你或許會說當然不一樣了,指針容易產生不安全的因素,引用卻不會,真的不會嗎?我們來看下面這段代碼:
int *e=new int(10);
int &f=*e;
delete e;
f=30;
你認爲上面這段代碼怎麼樣,我感覺就不很安全,它和指針有相同的隱患。因爲它所引用的內存區域就不合法。
我個人認爲,所謂的引用其實就是一種指針,只不過二者的接口並不相同,引用的接口有一定的限制。指針可以一對多,而引用卻只能一對一,即&refer不能被改變,但卻並不能說一對一就是安全的,只不過危險的係數降低罷了。引用比指針更容易控制。
Ok,下面來說說指針,曾經有過彙編經驗的人一定會說,恩,指針的某些地方有些像彙編,尤其是那個“*”,怎麼就那麼像彙編中的“[]”啊。呵呵,的確,它也涵蓋了一個尋址的過程。看來指針的確是個比較低級的東西。然而引用卻並不那麼直接,雖然程序員用起來方便安全了許多。但是你要清楚,只有你可以擁有引用,編譯器可沒有這個工具,計算機並不認識這個東西。因此,它的底層機制實際上是和指針一樣的。不要相信只有一塊內存拷貝,不要認爲引用可以爲你節省一個指針的空間,因爲這一切不會發生,編譯器還是會把引用解釋爲指針。不管你相不相信,請看下面這段代碼:
int& b=a;
lea eax,[a];
mov dword ptr[b],eax;把a的地址賦給地址爲b的一塊內存

b=50;
mov eax,dword ptr[b];
mov dword ptr[eax],32h;

int *d=&a;
lea eax,[a];
mov dword ptr[d],eax

*d=60;
mov eax,dword ptr[d]
mov dword ptr[eax],3ch;
以上的代碼均來自具體的編譯器,怎麼樣,相信了吧,好,讓我再來做一個或許不怎麼恰當的比擬,你一定編過有關線性表和棧的程序吧,線性表是一個非常靈活的數據結構,在他上面有許多的操作,然而棧呢,它是一個限制性操作的線性表,它的底層操作實際上是由線性表操作實現的。就好比stack與vector的關係,因此指針和引用的關係就好比線性表和棧的關係,引用也就是受限的指針,它對外的接口和指針雖然並不一樣,但底層是相同的。
下面再來看看引用的一個重要用途,作爲函數的參數傳遞的時候是怎樣的情形:
void swapr(int &a, int &b);
void swapr(int* a, int *b);

int a=10;
int b=20;

swapr(a, b);
lea eax,[a]; 
push eax; //把a的地址壓入堆棧
lea ecx,[b];
push ecx;
call swapr;

swapr(&a, &b);
lea eax,[a];
push eax;
lea ecx,[b];
push ecx;
call swapr;
怎麼樣,用引用和指針傳遞參數無論是在效率上還是在空間上都是完全一樣的,如果妄想不傳入地址就修改實參的值,簡直就是天方夜譚,這就說明引用的本質就是指針。畢竟它們的行爲都太相似了,如果不是這樣,你還有什麼方法去實現引用嗎?記住,引用只不過是編譯器爲你提供的一個有用且安全的工具,對於機器代碼可無法表示它,它把指針一對多的缺點去除,禁止了你的不安全的操作。但回到問題的本源,他們沒有任何區別。

都史的實例:

#include <iostream.h>

class A {
double *m_pDb;
};

class B {
double &m_db;
public:
B(double db = 0) : m_db(db) {}
};

int main() {
cout << "size of class A:"<<sizeof(A) << endl;
cout << "size of class B:"<<sizeof(B) << endl;
return 0;
}

結果:

size of class A:4

size of class B:4

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章