大內高手—棧/堆

 

大內高手/

 

轉載時請註明出處和作者聯繫方式:http://blog.csdn.net/absurd

作者聯繫方式:李先靜 <xianjimli at hotmail dot com>

更新時間:2007-7-9

l        

棧作爲一種基本數據結構,我並不感到驚訝,用來實現函數調用,這也司空見慣的作法。直到我試圖找到另外一種方式實現遞歸操作時,我才感嘆於它的巧妙。要實現遞歸操作,不用棧不是不可能,而是找不出比它更優雅的方式。

 

儘管大多數編譯器在優化時,會把常用的參數或者局部變量放入寄存器中。但用棧來管理函數調用時的臨時變量(局部變量和參數)是通用做法,前者只是輔助手段,且只在當前函數中使用,一旦調用下一層函數,這些值仍然要存入棧中才行。

 

通常情況下,棧向下(低地址)增長,每向棧中PUSH一個元素,棧頂就向低地址擴展,每從棧中POP一個元素,棧頂就向高地址回退。一個有興趣的問題:在x86平臺上,棧頂寄存器爲ESP,那麼ESP的值在是PUSH操作之前修改呢,還是在PUSH操作之後修改呢?PUSH ESP這條指令會向棧中存入什麼數據呢?據說x86系列CPU中,除了286外,都是先修改ESP,再壓棧的。由於286沒有CPUID指令,有的OS用這種方法檢查286的型號。

 

一個函數內的局部變量以及其調用下一級函數的參數,所佔用的內存空間作爲一個基本的單元,稱爲一個幀(frame)。在gdb裏,f 命令就是用來查看指定幀的信息的。在兩個frame之間通過還存有其它信息,比如上一層frame的分界地址(EBP)等。

 

關於棧的基本知識,就先介紹這麼多,我們下面來看看一些關於棧的技巧及應用:

1.         backtrace的實現

callstack調試器的基本功能之一,利用此功能,你可以看到各級函數的調用關係。在gdb中,這一功能被稱爲backtrace,輸入bt命令就可以看到當前函數的callstack。它的實現多少有些有趣,我們在這裏研究一下。

 

我們先看看棧的基本模型

參數N

↓高地址

參數

函數參數入棧的順序與具體的調用方式有關

參數 3

參數 2

參數 1

EIP

返回本次調用後,下一條指令的地址

EBP

保存調用者的EBP,然後EBP指向此時的棧頂。

臨時變量1

 

臨時變量2

 

臨時變量3

 

臨時變量

 

臨時變量5

↓低地址

 

要實現callstack我們需要知道以下信息:

l         調用函數時的指令地址(即當時的EIP)。

l         指令地址對應的源代碼代碼位置。

關於第一點,從上表中,我們可以看出,棧中存有各級EIP的值,我們取出來就行了。用下面的代碼可以輕易實現:

#include <stdio.h>

 

int backtrace(void** BUFFER, int SIZE)

{

    int  n = 0;

    int* p = &n;

    int  i = 0;

 

    int ebp = p[1];

    int eip = p[2];

 

    for(i = 0; i < SIZE; i++)

    {

        BUFFER[i] = (void*)eip;

        p = (int*)ebp;

        ebp = p[0];

        eip = p[1];

    }

 

    return SIZE;

}

 

#define N 4

static void test2()

{

    int i = 0;

    void* BUFFER[N] = {0};

 

    backtrace(BUFFER, N);

 

    for(i = 0; i < N; i++)

    {

        printf("%p/n",  BUFFER[i]);

    }

 

         return;

}

 

static void test1()

{

    test2();

}

 

static void test()

{

    test1();

}

 

int main(int argc, char* argv[])

{

    test();

 

    return 0;

}

程序輸出:

0x8048460

0x804849c

0x80484a9

0x80484cc

 

關於第二點,如何把指令地址與行號對應起來,這也很簡單。可以從MAP文件或者ELF中查詢。Binutil帶有一個addr2line的小工具,可以幫助實現這一點。

[root@linux bt]# addr2line  0x804849c -e bt.exe

/root/test/bt/bt.c:42

 

2.         alloca的實現

大家都知道動態分配的內存,一定要釋放掉,否則就會有內存泄露。可能鮮有人知,動態分配的內存,可以不用釋放。Alloca就是這樣一個函數,最後一個a代表auto,即自動釋放的意思。

 

Alloca是在棧中分配內存的。即然是在棧中分配,就像其它在棧中分配的臨時變量一樣,在當前函數調用完成時,這塊內存自動釋放。

 

正如我們前面講過,棧的大小是有限制的,普通線程的棧只有10M大小,所以在分配時,要量力而行,且不要分配過大內存。

 

Alloca可能會漸漸的退出歷史舞臺,原因是新的C/C++標準都支持變長數組。比如int array[n],老版本的編譯器要求n是常量,而新編譯器允許n是變量。編譯器支持的這一功能完全可以取代alloca

 

這不是一個標準函數,但像linuxwin32等大多數平臺都支持。即使少數平臺不支持,要自己實現也不難。這裏我們簡單介紹一下alloca的實現方法。

 

我們先看看一個小程序,再看看它對應的彙編代碼,一切都清楚了。

#include <stdio.h>

 

int main(int argc, char* argv[])

{

    int  n = 0;

    int* p = alloca(1024);

 

    printf("&n=%p p=%p/n", &n, p);

    return 0;

}

彙編代碼爲:

int main(int argc, char* argv[])

{

 8048394:       55                      push   %ebp

 8048395:       89 e5                   mov    %esp,%ebp

 8048397:       83 ec 18                sub    $0x18,%esp

 804839a:       83 e4 f0                and    $0xfffffff0,%esp

 804839d:       b8 00 00 00 00          mov    $0x0,%eax

 80483a2:       83 c0 0f                add    $0xf,%eax

 80483a5:       83 c0 0f                add    $0xf,%eax

 80483a8:       c1 e8 04                shr    $0x4,%eax

 80483ab:       c1 e0 04                shl    $0x4,%eax

 80483ae:       29 c4                   sub    %eax,%esp

        int  n = 0;

 80483b0:       c7 45 fc 00 00 00 00    movl   $0x0,0xfffffffc(%ebp)

        int* p = alloca(1024);

 80483b7:       81 ec 10 04 00 00       sub    $0x410,%esp

 80483bd:       8d 44 24 0c             lea    0xc(%esp),%eax

 80483c1:       83 c0 0f                add    $0xf,%eax

 80483c4:       c1 e8 04                shr    $0x4,%eax

 80483c7:       c1 e0 04                shl    $0x4,%eax

 80483ca:       89 45 f8                mov    %eax,0xfffffff8(%ebp)

 

        printf("&n=%p p=%p/n", &n, p);

 80483cd:       8b 45 f8                mov    0xfffffff8(%ebp),%eax

 80483d0:       89 44 24 08             mov    %eax,0x8(%esp)

 80483d4:       8d 45 fc                lea    0xfffffffc(%ebp),%eax

 80483d7:       89 44 24 04             mov    %eax,0x4(%esp)

 80483db:       c7 04 24 98 84 04 08    movl   $0x8048498,(%esp)

 80483e2:       e8 d1 fe ff ff          call   80482b8 <printf@plt>

        return 0;

 80483e7:       b8 00 00 00 00          mov    $0x0,%eax

}

 

其中關鍵的一條指令爲:sub    $0x410,%esp

由此可以看出實現alloca,僅僅是把ESP減去指定大小,擴大棧空間(記記住棧是向下增長),這塊空間就是分配的內存。

 

3.         可變參數的實現。

對新手來說,可變參數的函數也是比較神奇。還是以一個小程序來說明它的實現。

#include <stdio.h>

#include <stdarg.h>

 

int print(const char* fmt, ...)

{

    int n1 = 0;

    int n2 = 0;

    int n3 = 0;

    va_list ap;

    va_start(ap, fmt);

 

    n1 = va_arg(ap, int);

    n2 = va_arg(ap, int);

    n3 = va_arg(ap, int);

 

    va_end(ap);

 

    printf("n1=%d n2=%d n3=%d/n", n1, n2, n3);

 

    return 0;

}

 

int main(int arg, char argv[])

{

    print("%d/n", 1, 2, 3);

 

    return 0;

}

 

我們看看對應的彙編代碼:

int print(const char* fmt, ...)

{

 8048394:       55                      push   %ebp

 8048395:       89 e5                   mov    %esp,%ebp

 8048397:       83 ec 28                sub    $0x28,%esp

        int n1 = 0;

 804839a:       c7 45 fc 00 00 00 00    movl   $0x0,0xfffffffc(%ebp)

        int n2 = 0;

 80483a1:       c7 45 f8 00 00 00 00    movl   $0x0,0xfffffff8(%ebp)

        int n3 = 0;

 80483a8:       c7 45 f4 00 00 00 00    movl   $0x0,0xfffffff4(%ebp)

        va_list ap;

        va_start(ap, fmt);

 80483af:       8d 45 0c                lea    0xc(%ebp),%eax

 80483b2:       89 45 f0                mov    %eax,0xfffffff0(%ebp)

 

        n1 = va_arg(ap, int);

 80483b5:       8b 55 f0                mov    0xfffffff0(%ebp),%edx

 80483b8:       8d 45 f0                lea    0xfffffff0(%ebp),%eax

 80483bb:       83 00 04                addl   $0x4,(%eax)

 80483be:       8b 02                   mov    (%edx),%eax

 80483c0:       89 45 fc                mov    %eax,0xfffffffc(%ebp)

        n2 = va_arg(ap, int);

 80483c3:       8b 55 f0                mov    0xfffffff0(%ebp),%edx

 80483c6:       8d 45 f0                lea    0xfffffff0(%ebp),%eax

 80483c9:       83 00 04                addl   $0x4,(%eax)

 80483cc:       8b 02                   mov    (%edx),%eax

 80483ce:       89 45 f8                mov    %eax,0xfffffff8(%ebp)

        n3 = va_arg(ap, int);

 80483d1:       8b 55 f0                mov    0xfffffff0(%ebp),%edx

 80483d4:       8d 45 f0                lea    0xfffffff0(%ebp),%eax

 80483d7:       83 00 04                addl   $0x4,(%eax)

 80483da:       8b 02                   mov    (%edx),%eax

 80483dc:       89 45 f4                mov    %eax,0xfffffff4(%ebp)

 

        va_end(ap);

       printf("n1=%d n2=%d n3=%d/n", n1, n2, n3);

 80483df:       8b 45 f4                mov    0xfffffff4(%ebp),%eax

 80483e2:       89 44 24 0c             mov    %eax,0xc(%esp)

 80483e6:       8b 45 f8                mov    0xfffffff8(%ebp),%eax

 80483e9:       89 44 24 08             mov    %eax,0x8(%esp)

 80483ed:       8b 45 fc                mov    0xfffffffc(%ebp),%eax

 80483f0:       89 44 24 04             mov    %eax,0x4(%esp)

 80483f4:       c7 04 24 f8 84 04 08    movl   $0x80484f8,(%esp)

 80483fb:       e8 b8 fe ff ff          call   80482b8 <printf@plt>

 

        return 0;

 8048400:       b8 00 00 00 00          mov    $0x0,%eax

}

int main(int arg, char argv[])

{

 8048407:       55                      push   %ebp

 8048408:       89 e5                   mov    %esp,%ebp

 804840a:       83 ec 18                sub    $0x18,%esp

 804840d:       83 e4 f0                and    $0xfffffff0,%esp

 8048410:       b8 00 00 00 00          mov    $0x0,%eax

 8048415:       83 c0 0f                add    $0xf,%eax

 8048418:       83 c0 0f                add    $0xf,%eax

 804841b:       c1 e8 04                shr    $0x4,%eax

 804841e:       c1 e0 04                shl    $0x4,%eax

 8048421:       29 c4                   sub    %eax,%esp

        int n = print("%d/n", 1, 2, 3);

 8048423:       c7 44 24 0c 03 00 00    movl   $0x3,0xc(%esp)

 804842a:       00

 804842b:       c7 44 24 08 02 00 00    movl   $0x2,0x8(%esp)

 8048432:       00

 8048433:       c7 44 24 04 01 00 00    movl   $0x1,0x4(%esp)

 804843a:       00

 804843b:       c7 04 24 0b 85 04 08    movl   $0x804850b,(%esp)

 8048442:       e8 4d ff ff ff          call   8048394 <print>

 8048447:       89 45 fc                mov    %eax,0xfffffffc(%ebp)

 

        return 0;

 804844a:       b8 00 00 00 00          mov    $0x0,%eax

}

 

從彙編代碼中,我們可以看出,參數是逆序入棧的。在取參數時,先讓ap指向第一個參數,又因爲棧是向下增長的,不斷把指針向上移動就可以取出所有參數了。

 

l        

在內存分配算法一節中再詳細講解。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章