C語言內存對齊詳解

一、字節對齊基本概念

    現代計算機中內存空間都是按照byte劃分的,從理論上講似乎對任何類型的變量的訪問可以從任何地址開始,但實際情況是在訪問特定類型變量的時候經常在特定的內存地址訪問,這就需要各種類型數據按照一定的規則在空間上排列,而不是順序的一個接一個的排放,這就是對齊。 對齊的作用和原因:各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數據只能從某些特定地址開始存取。比如有些架構的CPU在訪問一個沒有進行對齊的變量的時候會發生錯誤,那麼在這種架構下編程必須保證字節對齊.其他平臺可能沒有這種情況,但是最常見的是如果不按照適合其平臺要求對數據存放進行對齊,會在存取效率上帶來損失。比如有些平臺每次讀都是從偶地址開始,如果一個int型(假設爲32位系統)如果存放在偶地址開始的地方,那 麼一個讀週期就可以讀出這32bit,而如果存放在奇地址開始的地方,就需要2個讀週期,並對兩次讀出的結果的高低字節進行拼湊才能得到該32bit數據。顯然在讀取效率上下降很多。

 本文地址:http://www.cnblogs.com/archimedes/p/memory-alignment.html,轉載請註明源地址。

請看下面的結構:

struct struct1 
{
  double dda;
  char cda;
  int ida;
};

sizeof(struct1) = ?

錯誤的求法:

sizeof(struct1)=sizeof(double)+sizeof(char)+sizeof(int)=13

但是當你運行如下測試代碼:

#include<stdio.h>struct mystruct
{    double dda;    char cda;    int ida;
};int main()
{    struct mystruct ss;
   printf("%d\n",sizeof(ss));    return 0;
}

運行結果爲:16

其實,這是編譯器對變量存儲的一個特殊處理。爲了提高CPU的存儲速度,編譯器對一些變量的起始地址做了“對齊”處理。在默認情況下,編譯器規定各成員變量存放的起始地址相對於結構的起始地址的偏移量必須爲該變量的類型所佔用的字節數的倍數。下面列出常用類型的對齊方式:

類型            對齊方式(變量存放的起始地址相對於結構的起始地址的偏移量)

char              偏移量必須爲sizeof(char)即1的倍數

int                偏移量必須爲sizeof(int)即4的倍數

float             偏移量必須爲sizeof(float)即4的倍數

double          偏移量必須爲sizeof(double)即8的倍數

Short            偏移量必須爲sizeof(short)即2的倍數


各成員變量在存放的時候根據在結構中出現的順序依次申請空間,同時按照上面的對齊方式調整位置,空缺的字節編譯器會自動填充。同時編譯器爲了確保結構的大小爲結構的字節邊界數(即該結構中佔用最大空間的類型所佔用的字節數)的倍數,所以在爲最後一個成員變量申請空間後,還會根據需要自動填充空缺的字節

現在來分析編譯器是怎樣來存放結構的:

struct struct1 
{
  double dda;
  char cda;
  int ida;
};

第一個成員dda分配空間,其起始地址跟結構的起始地址相同(偏移量0剛好爲sizeof(double)的倍數),該成員變量佔用sizeof(double)=8個字節;接下來爲第二個成員cda分配空間,這時下一個可以分配的地址對於結構的起始地址的偏移量爲8,是sizeof(char)的倍數,所以把cda存放在偏移量爲8的地方滿足對齊方式,該成員變量佔用 sizeof(char)=1個字節;接下來爲第三個成員ida分配空間,這時下一個可以分配的地址對於結構的起始地址的偏移量爲9,不是sizeof (int)=4的倍數,爲了滿足對齊方式對偏移量的約束問題,VC自動填充3個字節(這三個字節沒有放什麼東西),這時下一個可以分配的地址對於結構的起始地址的偏移量爲12,剛好是sizeof(int)=4的倍數,所以把ida存放在偏移量爲12的地方,該成員變量佔用sizeof(int)=4個字節;這時整個結構的成員變量已經都分配了空間,總的佔用的空間大小爲:8+1+3+4=16,剛好爲結構的字節邊界數(即結構中佔用最大空間的類型所佔用的字節數sizeof(double)=8)的倍數,沒有空缺的字節需要填充。所以整個結構的大小爲:sizeof(struct1)=8+1+ 3+4=16,其中有3個字節是VC自動填充的,沒有放任何有意義的東西。

下面再舉個例子,交換一下上面的struct1的成員變量的位置,使它變成下面的情況:

struct mystruct2
{    char cda;    double dda;    int ida;
};

 運行結果爲:24

struct mystruct2
{    char cda;    //偏移量爲0,滿足對齊方式,cda佔用1個字節;
   double dda;  //下一個可用的地址的偏移量爲1,不是sizeof(double)=8
                //的倍數,需要補足7個字節才能使偏移量變爲8(滿足對齊
                //方式),因此VC自動填充7個字節,dda存放在偏移量爲8
                //的地址上,它佔用8個字節。

   int ida;     //下一個可用的地址的偏移量爲16,是sizeof(int)=4的倍
                //數,滿足int的對齊方式,所以不需要VC自動填充,type存
                //放在偏移量爲16的地址上,它佔用4個字節。  
  //所有成員變量都分配了空間,空間總的大小爲1+7+8+4=20,不是結構
  //的節邊界數(即結構中佔用最大空間的類型所佔用的字節數sizeof
  //(double)=8)的倍數,所以需要填充4個字節,以滿足結構的大小爲
  //sizeof(double)=8的倍數。};

 所以該結構總的大小爲:sizeof(struct2)爲1+7+8+4+4=24。其中總的有7+4=11個字節是VC自動填充的,沒有放任何有意義的東西。

二、#pragma pack(n)來設定變量以n字節對齊方式

VC對結構的存儲的特殊處理確實提高CPU存儲變量的速度,但是有時候也帶來了一些麻煩,我們也屏蔽掉變量默認的對齊方式,自己可以設定變量的對齊方式。VC 中提供了#pragma pack(n)來設定變量以n字節對齊方式。n字節對齊就是說變量存放的起始地址的偏移量有兩種情況:

第一、如果n大於等於該變量所佔用的字節數,那麼偏移量必須滿足默認的對齊方式;

第二、如果n小於該變量的類型所佔用的字節數,那麼偏移量爲n的倍數,不用滿足默認的對齊方式。

結構的總大小也有個約束條件,分下面兩種情況:如果n大於所有成員變量類型所佔用的字節數,那麼結構的總大小必須爲佔用空間最大的變量佔用的空間數的倍數;否則必須爲n的倍數。下面舉例說明其用法:

#pragma pack(push) //保存對齊狀態 #pragma pack(4)//設定爲4字節對齊 struct test 
{
  char m1;
  double m4;
  int m3;
};
#pragma pack(pop)//恢復對齊狀態

以上結構的大小爲16,下面分析其存儲情況,首先爲m1分配空間,其偏移量爲0,滿足我們自己設定的對齊方式(4字節對齊),m1佔用1個字節。接着開始爲 m4分配空間,這時其偏移量爲1,需要補足3個字節,這樣使偏移量滿足爲n=4的倍數(因爲sizeof(double)大於n,m4佔用8個字節。接着爲m3分配空間,這時其偏移量爲12,滿足爲4的倍數,m3佔用4個字節。這時已經爲所有成員變量分配了空間,共分配了4+8+4=16個字節,滿足爲n的倍數。如果把上面的#pragma pack(4)改爲#pragma pack(16),那麼我們可以得到結構的大小爲24。

再看下面這個例子:

#pragma pack(8)struct S1{    char a;    long b;
};struct S2 {    char c;    struct S1 d;    long long e;
};#pragma pack()

成員對齊有一個重要的條件,即每個成員分別對齊.即每個成員按自己的方式對齊.

也就是說上面雖然指定了按8字節對齊,但並不是所有的成員都是以8字節對齊.其對齊的規則是,每個成員按其類型的對齊參數(通常是這個類型的大小)和指定對齊參數(這裏是8字節)中較小的一個對齊.並且結構的長度必須爲所用過的所有對齊參數的整數倍,不夠就補空字節.

S1中,成員a是1字節默認按1字節對齊,指定對齊參數爲8,這兩個值中取1,a按1字節對齊;成員b是4個字節,默認是按4字節對齊,這時就按4字節對齊,所以sizeof(S1)應該爲8;

S2 中,c和S1中的a一樣,按1字節對齊,而d 是個結構,它是8個字節,它按什麼對齊呢?對於結構來說,它的默認對齊方式就是它的所有成員使用的對齊參數中最大的一個,S1的就是4.所以,成員d就是按4字節對齊.成員e是8個字節,它是默認按8字節對齊,和指定的一樣,所以它對到8字節的邊界上,這時,已經使用了12個字節了,所以又添加了4個字節的空,從第16個字節開始放置成員e.這時,長度爲24,已經可以被8(成員e按8字節對齊)整除.這樣,sizeof(S2)爲24個字節.

這裏有三點很重要:

1.每個成員分別按自己的方式對齊,並能最小化長度。

2.複雜類型(如結構)的默認對齊方式是它最長的成員的對齊方式,這樣在成員是複雜類型時,可以最小化長度。

3.對齊後的長度必須是成員中最大的對齊參數的整數倍,這樣在處理數組時可以保證每一項都邊界對齊。

三、minix的stdarg.h文件中對齊方式

在minix的stdarg.h文件中,定義瞭如下一個宏:

/* Amount of space required in an argument list for an arg of type TYPE.
* TYPE may alternatively be an expression whose type is used. */#define __va_rounded_size(TYPE)  \
 (((sizeof (TYPE) + sizeof (int) - 1) / sizeof (int)) * sizeof (int))

從註釋以及宏的名字可以看出是有關內存對齊方面的作用。根據前面關於C語言內存對齊方面的理論可知

n字節對齊就是說變量存放的起始地址的偏移量有兩種情況:

第一、如果n大於等於該變量所佔用的字節數,那麼偏移量必須滿足默認的對齊方式(各成員變量存放的起始地址相對於結構的起始地址的偏移量必須爲該變量的類型所佔用的字節數的倍數);

第二、如果n小於該變量的類型所佔用的字節數,那麼偏移量爲n的倍數,不用滿足默認的對齊方式。

此時n = 4,對於sizeof(TYPE)一定爲自然數,sizeof(int) - 1 = 3

sizeof(TYPE)只可能出現如下兩種情況:

(1) 當sizeof(TYPE) >= 4,偏移量 = (sizeof(TYPE)/4)*4

(2) 當sizeof(TYPE) < 4,偏移量 = 4

此時sizeof(TYPE) = 1 or 2 or 3,而(sizeof(TYPE) + 3) / 4  = 1

爲了將上述兩種情況統一,偏移量 = ((sizeof(TYPE) + 3) / 4) * 4


 在有的源代碼中,將內存對齊宏__va_rounded_size通過位操作來實現,代碼如下:

#define __va_rounded_size(TYPE)  \
  ((sizeof(TYPE)+sizeof(int)-1)&~(sizeof(int)-1))

 由於 ~(sizeof(int) – 1) ) = ~(4-1)=~(00000011B)=11111100B

(sizeof(TYPE) + sizeof(int) – 1)就是將大於4m但小於等於4(m+1)的數提高到大於等於4(m+1)但小於4(m+2),這樣再& ~(sizeof(int) – 1) )後就正好將原長度補齊到4的倍數了。

出處:http://www.cnblogs.com/wuyudong/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章