C語言中如何使用宏 包括單雙井號 可變參數

C(和C++)中的宏(Macro)屬於編譯器預處理的範疇,屬於編譯期概念(而非運行期概念)。下面對常遇到的宏的使用問題做了簡單總結。

關於#和##

在C語言的宏中,#的功能是將其後面的宏參數進行字符串化操作(Stringfication),簡單說就是在對它所引用的宏變量通過替換後在其左右各加上一個雙引號。比如下面代碼中的宏:

#define WARN_IF(EXP) /

  do{ if (EXP) /

  fprintf(stderr, "Warning: " #EXP "/n"); } /

  while(0)

那麼實際使用中會出現下面所示的替換過程:

WARN_IF (divider == 0);


  被替換爲


do {

  if (divider == 0)

  fprintf(stderr, "Warning" "divider == 0" "/n");

} while(0);

這樣每次divider(除數)爲0的時候便會在標準錯誤流上輸出一個提示信息。

而## 被稱爲連接符(concatenator),用來將兩個Token連接爲一個Token。注意這裏連接的對象是Token就行,而不一定是宏的變量。比如你要做一個菜單項命令名和函數指針組成的結構體的數組,並且希望在函數名和菜單項命令名之間有直觀的、名字上的關係。那麼下面的代碼就非常實用:

struct command

{

  char * name;

  void (*function) (void);

};


#define COMMAND(NAME) { NAME, NAME ## _command }


// 然後你就用一些預先定義好的命令來方便的初始化一個command結構的數組了:


struct command commands[] = {

  COMMAND(quit),

  COMMAND(help),

  ...

}

COMMAND宏在這裏充當一個代碼生成器的作用,這樣可以在一定程度上減少代碼密度,間接地也可以減少不留心所造成的錯誤。我們還可以n個##符號連接 n+1個Token,這個特性也是#符號所不具備的。比如:

#define LINK_MULTIPLE(a,b,c,d) a##_##b##_##c##_##d


typedef struct _record_type LINK_MULTIPLE(name,company,position,salary);

// 這裏這個語句將展開爲:

// typedef struct _record_type name_company_position_salary;

關於...的使用

...在C宏中稱爲Variadic Macro,也就是變參宏。比如:

#define myprintf(templt,...) fprintf(stderr,templt,__VA_ARGS__)


  // 或者


#define myprintf(templt,args...) fprintf(stderr,templt,args)

第一個宏中由於沒有對變參起名,我們用默認的宏__VA_ARGS__來替代它。第二個宏中,我們顯式地命名變參爲args,那麼我們在宏定義中就可以用 args來代指變參了。同C語言的stdcall一樣,變參必須作爲參數表的最有一項出現。當上面的宏中我們只能提供第一個參數templt時,C標準要求我們必須寫成:

myprintf(templt,);

的形式。這時的替換過程爲:

myprintf("Error!/n",);


  替換爲:

  

fprintf(stderr,"Error!/n",);

這是一個語法錯誤,不能正常編譯。這個問題一般有兩個解決方法。首先,GNU CPP提供的解決方法允許上面的宏調用寫成:

myprintf(templt);

而它將會被通過替換變成:

fprintf(stderr,"Error!/n",);

很明顯,這裏仍然會產生編譯錯誤(非本例的某些情況下不會產生編譯錯誤)。除了這種方式外,c99和GNU CPP都支持下面的宏定義方式:

#define myprintf(templt, ...) fprintf(stderr,templt, ##__VAR_ARGS__)

這時,##這個連接符號充當的作用就是當__VAR_ARGS__爲空的時候,消除前面的那個逗號。那麼此時的翻譯過程如下:

myprintf(templt);


  被轉化爲:


fprintf(stderr,templt);

這樣如果templt合法,將不會產生編譯錯誤。 這裏列出了一些宏使用中容易出錯的地方,以及合適的使用方式。

 

錯誤的嵌套-Misnesting

宏的定義不一定要有完整的、配對的括號,但是爲了避免出錯並且提高可讀性,最好避免這樣使用。

由操作符優先級引起的問題-Operator Precedence Problem

由於宏只是簡單的替換,宏的參數如果是複合結構,那麼通過替換之後可能由於各個參數之間的操作符優先級高於單個參數內部各部分之間相互作用的操作符優先級,如果我們不用括號保護各個宏參數,可能會產生預想不到的情形。比如:

#define ceil_div(x, y) (x + y - 1) / y

那麼

a = ceil_div( b & c, sizeof(int) );

將被轉化爲:

a = ( b & c + sizeof(int) - 1) / sizeof(int);

  // 由於+/-的優先級高於&的優先級,那麼上面式子等同於:

a = ( b & (c + sizeof(int) - 1)) / sizeof(int);

這顯然不是調用者的初衷。爲了避免這種情況發生,應當多寫幾個括號:

#define ceil_div(x, y) (((x) + (y) - 1) / (y))

消除多餘的分號-Semicolon Swallowing

通常情況下,爲了使函數模樣的宏在表面上看起來像一個通常的C語言調用一樣,通常情況下我們在宏的後面加上一個分號,比如下面的帶參宏:

MY_MACRO(x);

但是如果是下面的情況:

#define MY_MACRO(x) { /

  /* line 1 */ /

  /* line 2 */ /

  /* line 3 */ }

  

//...


if (condition())

  MY_MACRO(a);

else

  {...}

這樣會由於多出的那個分號產生編譯錯誤。爲了避免這種情況出現同時保持MY_MACRO(x);的這種寫法,我們需要把宏定義爲這種形式:

#define MY_MACRO(x) do {

  /* line 1 */ /

  /* line 2 */ /

  /* line 3 */ } while(0)

這樣只要保證總是使用分號,就不會有任何問題。

Duplication of Side Effects

這裏的Side Effect是指宏在展開的時候對其參數可能進行多次Evaluation(也就是取值),但是如果這個宏參數是一個函數,那麼就有可能被調用多次從而達到不一致的結果,甚至會發生更嚴重的錯誤。比如:

#define min(X,Y) ((X) > (Y) ? (Y) : (X))


  //...

  

c = min(a,foo(b));

這時foo()函數就被調用了兩次。爲了解決這個潛在的問題,我們應當這樣寫min(X,Y)這個宏:

#define min(X,Y) ({ /

  typeof (X) x_ = (X); /

  typeof (Y) y_ = (Y); /

  (x_ < y_) ? x_ : y_; })

({...})的作用是將內部的幾條語句中最後一條的值返回,它也允許在內部聲明變量(因爲它通過大括號組成了一個局部Scope)。

==

#define display(name) printf(""#name"")
int main() {
  display(name);
}
運行結果是name,爲什麼不是"#name"呢?
---------------------------------------------------------------

#在這裏是字符串化的意思
printf(""#name"") 相當於
printf("" "name" "")
---------------------------------------------------------------

The number-sign or "stringizing" operator (#) converts macro parameters (after expansion) to string constants
---------------------------------------------------------------

printf("" #name "") <1>
相當於printf("" "name" "") <2>
而<2>中的第2,3個“中間時空格 等價於("空+name+空')
---------------------------------------------------------------

## 連接符與# 符

## 連接符號由兩個井號組成,其功能是在帶參數的宏定義中將兩個子串(token)聯接起來,從而形成一個新的子串。但它不可以是第一個或者最後一個子串。所謂的子串 (token)就是指編譯器能夠識別的最小語法單元。具體的定義在編譯原理裏有詳盡的解釋,但不知道也無所謂。同時值得注意的是#符是把傳遞過來的參數當成字符串進行替代。下面來看看它們是怎樣工作的。這是MSDN上的一個例子。

假設程序中已經定義了這樣一個帶參數的宏:
#define paster( n ) printf( "token" #n " = %d", token##n )

同時又定義了一個整形變量:
int token9 = 9;

現在在主程序中以下面的方式調用這個宏:
paster( 9 );

那麼在編譯時,上面的這句話被擴展爲:
printf( "token" "9" " = %d", token9 );

注意到在這個例子中,paster(9);中的這個”9”被原封不動的當成了一個字符串,與”token”連接在了一起,從而成爲了token9。而#n也被”9”所替代。

可想而知,上面程序運行的結果就是在屏幕上打印出token9=9
---------------------------------------------------------------

#define display(name) printf(""#name"")
int main() {
  display(name);
}
====================================
特殊性就在於它是個宏,宏裏面處理#號就如LS所說!
處理後就是一個附加的字符串!

但printf(""#name"") ;就不行了!
---------------------------------------------------------------

#define display(name) printf(""#name"")

該定義 字符串化name,
得到結果其實就是 printf("name")
(前後的空字符串拿掉)

這樣輸出來的自然是 name

從另外一個角度講,
#是一個連接符號,
參與運算了, 自然不會輸出了 ...


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章