C 語言中的指針和內存泄漏

引言

對於任何使用 C 語言的人,如果問他們 C 語言的最大煩惱是什麼,其中許多人可能會回答說是指針和內存泄漏。這些的確是消耗了開發人員大多數調試時間的事項。指針和內存泄漏對某些開發人員來說似乎令人畏懼,但是一旦您瞭解了指針及其關聯內存操作的基礎,它們就是您在 C 語言中擁有的最強大工具。

本文將與您分享開發人員在開始使用指針來編程前應該知道的祕密。本文內容包括:

  • 導致內存破壞的指針操作類型
  • 在使用動態內存分配時必須考慮的檢查點
  • 導致內存泄漏的場景

如果您預先知道什麼地方可能出錯,那麼您就能夠小心避免陷阱,並消除大多數與指針和內存相關的問題。

什麼地方可能出錯?

有幾種問題場景可能會出現,從而可能在完成生成後導致問題。在處理指針時,您可以使用本文中的信息來避免許多問題。

未初始化的內存

在本例中,p 已被分配了 10 個字節。這 10 個字節可能包含垃圾數據,如圖 1 所示。

char *p = malloc ( 10 );


圖 1. 垃圾數據
 

如果在對這個 p 賦值前,某個代碼段嘗試訪問它,則可能會獲得垃圾值,您的程序可能具有不可預測的行爲。p 可能具有您的程序從未曾預料到的值。

良好的實踐是始終結合使用 memset 和 malloc,或者使用 calloc

char *p = malloc (10);
memset(p,’\0’,10);

現在,即使同一個代碼段嘗試在對 p 賦值前訪問它,該代碼段也能正確處理 Null 值(在理想情況下應具有的值),然後將具有正確的行爲。

內存覆蓋

由於 p 已被分配了 10 個字節,如果某個代碼片段嘗試向 p 寫入一個 11 字節的值,則該操作將在不告訴您的情況下自動從其他某個位置“吃掉”一個字節。讓我們假設指針 q 表示該內存。


圖 2. 原始 q 內容
 

圖 3. 覆蓋後的 q 內容
 

結果,指針 q 將具有從未預料到的內容。即使您的模塊編碼得足夠好,也可能由於某個共存模塊執行某些內存操作而具有不正確的行爲。下面的示例代碼片段也可以說明這種場景。

char *name = (char *) malloc(11); 
// Assign some value to name
memcpy ( p,name,11); // Problem begins here 

在本例中,memcpy 操作嘗試將 11 個字節寫到 p,而後者僅被分配了 10 個字節。

作爲良好的實踐,每當向指針寫入值時,都要確保對可用字節數和所寫入的字節數進行交叉覈對。一般情況下,memcpy 函數將是用於此目的的檢查點。

內存讀取越界

內存讀取越界 (overread) 是指所讀取的字節數多於它們應有的字節數。這個問題並不太嚴重,在此就不再詳述了。下面的代碼提供了一個示例。

char *ptr = (char *)malloc(10);
char name[20] ;
memcpy ( name,ptr,20); // Problem begins here

在本例中,memcpy 操作嘗試從 ptr 讀取 20 個字節,但是後者僅被分配了 10 個字節。這還會導致不希望的輸出。

內存泄漏

內存泄漏可能真正令人討厭。下面的列表描述了一些導致內存泄漏的場景。

  • 重新賦值

    我將使用一個示例來說明重新賦值問題。

    char *memoryArea = malloc(10);
    char *newArea = malloc(10);

    這向如下面的圖 4 所示的內存位置賦值。



    圖 4. 內存位置
     

    memoryArea 和 newArea 分別被分配了 10 個字節,它們各自的內容如圖 4 所示。如果某人執行如下所示的語句(指針重新賦值)……

    memoryArea = newArea; 

    則它肯定會在該模塊開發的後續階段給您帶來麻煩。

    在上面的代碼語句中,開發人員將 memoryArea 指針賦值給 newArea 指針。結果,memoryArea 以前所指向的內存位置變成了孤立的,如下面的圖 5 所示。它無法釋放,因爲沒有指向該位置的引用。這會導致 10 個字節的內存泄漏。



    圖 5. 內存泄漏
     

    在對指針賦值前,請確保內存位置不會變爲孤立的。

  • 首先釋放父塊

    假設有一個指針 memoryArea,它指向一個 10 字節的內存位置。該內存位置的第三個字節又指向某個動態分配的 10 字節的內存位置,如圖 6 所示。



    圖 6. 動態分配的內存 
     

    free(memoryArea)

    如果通過調用 free 來釋放了 memoryArea,則 newArea 指針也會因此而變得無效。newArea 以前所指向的內存位置無法釋放,因爲已經沒有指向該位置的指針。換句話說,newArea 所指向的內存位置變爲了孤立的,從而導致了內存泄漏。

    每當釋放結構化的元素,而該元素又包含指向動態分配的內存位置的指針時,應首先遍歷子內存位置(在此例中爲newArea),並從那裏開始釋放,然後再遍歷回父節點。

    這裏的正確實現應該爲:

    free( memoryArea->newArea);
    free(memoryArea);

  • 返回值的不正確處理

    有時,某些函數會返回對動態分配的內存的引用。跟蹤該內存位置並正確地處理它就成爲了 calling 函數的職責。

    char *func ( )
    {
    		return malloc(20); // make sure to memset this location to ‘\0’…
    }
    
    void callingFunc ( )
    {
    		func ( ); // Problem lies here
    }

    在上面的示例中,callingFunc() 函數中對 func() 函數的調用未處理該內存位置的返回地址。結果,func() 函數所分配的 20 個字節的塊就丟失了,並導致了內存泄漏。

歸還您所獲得的

在開發組件時,可能存在大量的動態內存分配。您可能會忘了跟蹤所有指針(指向這些內存位置),並且某些內存段沒有釋放,還保持分配給該程序。

始終要跟蹤所有內存分配,並在任何適當的時候釋放它們。事實上,可以開發某種機制來跟蹤這些分配,比如在鏈表節點本身中保留一個計數器(但您還必須考慮該機制的額外開銷)。

訪問空指針

訪問空指針是非常危險的,因爲它可能使您的程序崩潰。始終要確保您不是 在訪問空指針。

總結

本文討論了幾種在使用動態內存分配時可以避免的陷阱。要避免內存相關的問題,良好的實踐是:

  • 始終結合使用 memset 和 malloc,或始終使用 calloc
  • 每當向指針寫入值時,都要確保對可用字節數和所寫入的字節數進行交叉覈對。
  • 在對指針賦值前,要確保沒有內存位置會變爲孤立的。
  • 每當釋放結構化的元素(而該元素又包含指向動態分配的內存位置的指針)時,都應首先遍歷子內存位置並從那裏開始釋放,然後再遍歷回父節點。
  • 始終正確處理返回動態分配的內存引用的函數返回值。
  • 每個 malloc 都要有一個對應的 free。
  • 確保您不是在訪問空指針。
發佈了7 篇原創文章 · 獲贊 14 · 訪問量 32萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章