1、inline函數不要超過10行代碼,且不能包含循環、switch、if語句
2、在一個c文件中定義的inline函數是不能在其它c文件中直接使用,google推薦把inline函數定義在**-inl.h頭文件中。
3、不要過度使用inline函數定義,尤其對大函數來說
上面三點說明如何正確的使用inline函數,我以前的時候對inline理解不透徹,使用inline的方式不正確,但現在編譯器夠先進,能保證錯誤的inline定義也可以正確編譯、運行。可能會有性能的缺失。
我在F14(gcc 版本 4.5.1 20100924 (Red Hat 4.5.1-4) (GCC))上做了個實驗:
1、當inline函數超過10行,並且包含了循環、switch語句後gcc會執行inline語義,將inline函數彙編嵌入到main函數中
//gcc n.c -O2 -S
#include <stdio.h>
inline int inc_inline(volatile int *j)
{
for(; *j<100; (*j)++)
{
*j += 2;
(*j)++;
}
switch (*j)
{
case 1:
(*j)++;
break;
case 2:
(*j)++;
break;
default:
break;
}
return (*j)++;
}
int main(int argc, char *argv[])
{
volatile int i = 0;
inc_inline(&i);
printf("i=%d\n", i);
return 0;
}
2、當我把inline函數的定義放到另一個c文件中,在main函數文件中聲明此函數,此時inline函數不生效,gcc編譯出的彙編使用call進行正常的函數調用。
//gcc n.c a.c -O2 -S
3、當我們過度使用inline函數,會造成程序文件變大,性能降低。程序文件變大是肯定的,但爲什麼性能會降低呢,inline不是爲了提高性能嗎?使用的方式不正確性能不能提高,反而會下降。現在的CPU上都有cache,緊湊的代碼在chache中保存的時間更長,這樣cache命中的機會更高。
如果某個A函數未定義爲inline,並且被很多其它函數調用,那個這個A函數很大的可能會長期被保存在cahe中,這樣CPU對代碼的執行速度會提高很多。如果A函數被定義爲了inline函數,代碼分散各個調用函數中,這樣每次指定都不命中都需要去內存把代碼拷貝到cache中,然後執行,造成很大的抖動。
更深一層的理解,當函數整個函數編譯爲的彙編代碼,函數調用的上下文切換佔用了大多的時間的時候,可以考慮把此函數定義爲inline函數。