GCC __asm__例子 - 台部落

__asm__是GCC關鍵字asm的宏定義：

#define __asm__ asm

__asm__或asm用來聲明一個內聯彙編表達式，所以任何一個內聯彙編表達式都是以它開頭的，是必不可少的。

2、Instruction List

Instruction List是彙編指令序列。它可以是空的，比如：__asm__ __volatile__(""); 或__asm__ ("");都是完全合法的內聯彙編表達式，只不過這兩條語句沒有什麼意義。但並非所有Instruction List爲空的內聯彙編表達式都是沒有意義的，比如：__asm__ ("":::"memory"); 就非常有意義，它向GCC聲明：“我對內存作了改動”，GCC在編譯的時候，會將此因素考慮進去。

我們看一看下面這個例子：

$ cat example1.c

int main(int __argc, char* __argv[])
{
int* __p = (int*)__argc;

(*__p) = 9999;

//__asm__("":::"memory");

if((*__p) == 9999)
return 5;

return (*__p);
}

在這段代碼中，那條內聯彙編是被註釋掉的。在這條內聯彙編之前，內存指針__p所指向的內存被賦值爲9999，隨即在內聯彙編之後，一條if語句判斷__p 所指向的內存與9999是否相等。很明顯，它們是相等的。GCC在優化編譯的時候能夠很聰明的發現這一點。我們使用下面的命令行對其進行編譯：

$ gcc -O -S example1.c

選項-O表示優化編譯，我們還可以指定優化等級，比如-O2表示優化等級爲2；選項-S表示將C/C++源文件編譯爲彙編文件，文件名和C/C++文件一樣，只不過擴展名由.c變爲.s。

我們來查看一下被放在example1.s中的編譯結果，我們這裏僅僅列出了使用gcc 2.96在redhat 7.3上編譯後的相關函數部分彙編代碼。爲了保持清晰性，無關的其它代碼未被列出。

$ cat example1.s

main:
pushl %ebp
movl %esp, %ebp
movl 8(%ebp), %eax # int* __p = (int*)__argc
movl $9999, (%eax) # (*__p) = 9999
movl $5, %eax # return 5
popl %ebp
ret

參照一下C源碼和編譯出的彙編代碼，我們會發現彙編代碼中，沒有if語句相關的代碼，而是在賦值語句(*__p)=9999後直接return 5；這是因爲GCC認爲在(*__p)被賦值之後，在if語句之前沒有任何改變(*__p)內容的操作，所以那條if語句的判斷條件(*__p) == 9999肯定是爲true的，所以GCC就不再生成相關代碼，而是直接根據爲true的條件生成return 5的彙編代碼（GCC使用eax作爲保存返回值的寄存器）。

我們現在將example1.c中內聯彙編的註釋去掉，重新編譯，然後看一下相關的編譯結果。

$ gcc -O -S example1.c

$ cat example1.s

main:
pushl %ebp
movl %esp, %ebp
movl 8(%ebp), %eax # int* __p = (int*)__argc
movl $9999, (%eax) # (*__p) = 9999
#APP

# __asm__("":::"memory")
#NO_APP
cmpl $9999, (%eax) # (*__p) == 9999 ?
jne .L3 # false
movl $5, %eax # true, return 5
jmp .L2
.p2align 2
.L3:
movl (%eax), %eax
.L2:
popl %ebp
ret

由於內聯彙編語句__asm__("":::"memory")向GCC聲明，在此內聯彙編語句出現的位置內存內容可能了改變，所以GCC在編譯時就不能像剛纔那樣處理。這次，GCC老老實實的將if語句生成了彙編代碼。

可能有人會質疑：爲什麼要使用__asm__("":::"memory")向GCC聲明內存發生了變化？明明“Instruction List”是空的，沒有任何對內存的操作，這樣做只會增加GCC生成彙編代碼的數量。

確實，那條內聯彙編語句沒有對內存作任何操作，事實上它確實什麼都沒有做。但影響內存內容的不僅僅是你當前正在運行的程序。比如，如果你現在正在操作的內存是一塊內存映射，映射的內容是外圍I/O設備寄存器。那麼操作這塊內存的就不僅僅是當前的程序，I/O設備也會去操作這塊內存。既然兩者都會去操作同一塊內存，那麼任何一方在任何時候都不能對這塊內存的內容想當然。所以當你使用高級語言C/C++寫這類程序的時候，你必須讓編譯器也能夠明白這一點，畢竟高級語言最終要被編譯爲彙編代碼。

你可能已經注意到了，這次輸出的彙編結果中，有兩個符號：#APP和#NO_APP，GCC將內聯彙編語句中"Instruction List"所列出的指令放在#APP和#NO_APP之間，由於__asm__("":::"memory")中“Instruction List”爲空，所以#APP和#NO_APP中間也沒有任何內容。但我們以後的例子會更加清楚的表現這一點。

關於爲什麼內聯彙編__asm__("":::"memory")是一條聲明內存改變的語句，我們後面會詳細討論。

剛纔我們花了大量的內容來討論"Instruction List"爲空是的情況，但在實際的編程中，"Instruction List"絕大多數情況下都不是空的。它可以有1條或任意多條彙編指令。

當在"Instruction List"中有多條指令的時候，你可以在一對引號中列出全部指令，也可以將一條或幾條指令放在一對引號中，所有指令放在多對引號中。如果是前者，你可以將每一條指令放在一行，如果要將多條指令放在一行，則必須用分號（；）或換行符（\n，大多數情況下\n後還要跟一個\t，其中\n是爲了換行，\t是爲了空出一個tab寬度的空格）將它們分開。比如：

__asm__("movl %eax, %ebx
sti
popl %edi
subl %ecx, %ebx");

__asm__("movl %eax, %ebx; sti
popl %edi; subl %ecx, %ebx");

__asm__("movl %eax, %ebx; sti\n\t popl %edi
subl %ecx, %ebx");

都是合法的寫法。如果你將指令放在多對引號中，則除了最後一對引號之外，前面的所有引號裏的最後一條指令之後都要有一個分號(；)或(\n)或(\n\t)。比如：

__asm__("movl %eax, %ebx
sti\n"
"popl %edi;"
"subl %ecx, %ebx");

__asm__("movl %eax, %ebx; sti\n\t"
"popl %edi; subl %ecx, %ebx");

__asm__("movl %eax, %ebx; sti\n\t popl %edi\n"
"subl %ecx, %ebx");

__asm__("movl %eax, %ebx; sti\n\t popl %edi;" "subl %ecx, %ebx");

都是合法的。

上述原則可以歸結爲：

任意兩個指令間要麼被分號(；)分開，要麼被放在兩行；
放在兩行的方法既可以從通過\n的方法來實現，也可以真正的放在兩行；
可以使用1對或多對引號，每1對引號裏可以放任一多條指令，所有的指令都要被放到引號中。
在基本內聯彙編中，“Instruction List”的書寫的格式和你直接在彙編文件中寫非內聯彙編沒有什麼不同，你可以在其中定義Label，定義對齊(.align n )，定義段(.section name )。例如：

__asm__(".align 2\n\t"
"movl %eax, %ebx\n\t"
"test %ebx, %ecx\n\t"
"jne error\n\t"
"sti\n\t"
"error: popl %edi\n\t"
"subl %ecx, %ebx");

上面例子的格式是Linux內聯代碼常用的格式，非常整齊。也建議大家都使用這種格式來寫內聯彙編代碼。

3、__volatile__

__volatile__是GCC關鍵字volatile的宏定義：

#define __volatile__ volatile

__volatile__ 或volatile是可選的，你可以用它也可以不用它。如果你用了它，則是向GCC聲明“不要動我所寫的Instruction List，我需要原封不動的保留每一條指令”，否則當你使用了優化選項(-O)進行編譯時，GCC將會根據自己的判斷決定是否將這個內聯彙編表達式中的指令優化掉。

那麼GCC判斷的原則是什麼？我不知道（如果有哪位朋友清楚的話，請告訴我）。我試驗了一下，發現一條內聯彙編語句如果是基本內聯彙編的話（即只有“Instruction List”，沒有Input/Output/Clobber的內聯彙編，我們後面將會討論這一點），無論你是否使用__volatile__來修飾， GCC 2.96在優化編譯時，都會原封不動的保留內聯彙編中的“Instruction List”。但或許我的試驗的例子並不充分，所以這一點並不能夠得到保證。

爲了保險起見，如果你不想讓GCC的優化影響你的內聯彙編代碼，你最好在前面都加上__volatile__，而不要依賴於編譯器的原則，因爲即使你非常瞭解當前編譯器的優化原則，你也無法保證這種原則將來不會發生變化。而__volatile__的含義卻是恆定的。

2、帶有C/C++表達式的內聯彙編

GCC允許你通過C/C++表達式指定內聯彙編中"Instrcuction List"中指令的輸入和輸出，你甚至可以不關心到底使用哪個寄存器被使用，完全靠GCC來安排和指定。這一點可以讓程序員避免去考慮有限的寄存器的使用，也可以提高目標代碼的效率。

我們先來看幾個例子：

__asm__ (" " : : : "memory" ); // 前面提到的

__asm__ ("mov %%eax, %%ebx" : "=b"(rv) : "a"(foo) : "eax", "ebx");

__asm__ __volatile__("lidt %0": "=m" (idt_descr));

__asm__("subl %2,%0\n\t"
"sbbl %3,%1"
: "=a" (endlow), "=d" (endhigh)
: "g" (startlow), "g" (starthigh), "0" (endlow), "1" (endhigh));

怎麼樣，有點印象了吧，是不是也有點暈？沒關係，下面討論完之後你就不會再暈了。（當然，也有可能更暈^_^）。討論開始——

帶有C/C++表達式的內聯彙編格式爲：

__asm__　__volatile__("Instruction List" : Output : Input : Clobber/Modify);

從中我們可以看出它和基本內聯彙編的不同之處在於：它多了3個部分(Input，Output，Clobber/Modify)。在括號中的4個部分通過冒號(:)分開。

這4個部分都不是必須的，任何一個部分都可以爲空，其規則爲：

如果Clobber/Modify爲空，則其前面的冒號(:)必須省略。比如__asm__("mov %%eax, %%ebx" : "=b"(foo) : "a"(inp) : )就是非法的寫法；而__asm__("mov %%eax, %%ebx" : "=b"(foo) : "a"(inp) )則是正確的。
如果Instruction List爲空，則Input，Output，Clobber/Modify可以不爲空，也可以爲空。比如__asm__ ( " " : : : "memory" );和__asm__(" " : : );都是合法的寫法。
如果Output，Input，Clobber/Modify都爲空，Output，Input之前的冒號(:)既可以省略，也可以不省略。如果都省略，則此彙編退化爲一個基本內聯彙編，否則，仍然是一個帶有C/C++表達式的內聯彙編，此時"Instruction List"中的寄存器寫法要遵守相關規定，比如寄存器前必須使用兩個百分號(%%)，而不是像基本彙編格式一樣在寄存器前只使用一個百分號(%)。比如 __asm__( " mov %%eax, %%ebx" : : )；__asm__( " mov %%eax, %%ebx" : )和__asm__( " mov %eax, %ebx" )都是正確的寫法，而__asm__( " mov %eax, %ebx" : : )；__asm__( " mov %eax, %ebx" : )和__asm__( " mov %%eax, %%ebx" )都是錯誤的寫法。
如果Input，Clobber/Modify爲空，但Output不爲空，Input前的冒號(:)既可以省略，也可以不省略。比如 __asm__( " mov %%eax, %%ebx" : "=b"(foo) : )；__asm__( " mov %%eax, %%ebx" : "=b"(foo) )都是正確的。
如果後面的部分不爲空，而前面的部分爲空，則前面的冒號(:)都必須保留，否則無法說明不爲空的部分究竟是第幾部分。比如， Clobber/Modify，Output爲空，而Input不爲空，則Clobber/Modify前的冒號必須省略（前面的規則），而Output 前的冒號必須爲保留。如果Clobber/Modify不爲空，而Input和Output都爲空，則Input和Output前的冒號都必須保留。比如 __asm__( " mov %%eax, %%ebx" : : "a"(foo) )和__asm__( " mov %%eax, %%ebx" : : : "ebx" )。
從上面的規則可以看到另外一個事實，區分一個內聯彙編是基本格式的還是帶有C/C++表達式格式的，其規則在於在"Instruction List"後是否有冒號(:)的存在，如果沒有則是基本格式的，否則，則是帶有C/C++表達式格式的。

兩種格式對寄存器語法的要求不同：基本格式要求寄存器前只能使用一個百分號(%)，這一點和非內聯彙編相同；而帶有C/C++表達式格式則要求寄存器前必須使用兩個百分號(%%)，其原因我們會在後面討論。

1. Output

Output用來指定當前內聯彙編語句的輸出。我們看一看這個例子：

__asm__("movl %%cr0, %0": "=a" (cr0));

這個內聯彙編語句的輸出部分爲"=r"(cr0)，它是一個“操作表達式”，指定了一個輸出操作。我們可以很清楚得看到這個輸出操作由兩部分組成：括號括住的部分(cr0)和引號引住的部分"=a"。這兩部分都是每一個輸出操作必不可少的。括號括住的部分是一個C/C++表達式，用來保存內聯彙編的一個輸出值，其操作就等於C/C++的相等賦值cr0 = output_value，因此，括號中的輸出表達式只能是C/C++的左值表達式，也就是說它只能是一個可以合法的放在C/C++賦值操作中等號(=) 左邊的表達式。那麼右值output_value從何而來呢

括號中的表達式cpu->db7是一個C/C++語言的表達式，它不必是一個左值表達式，也就是說它不僅可以是放在C/C++賦值操作左邊的表達式，還可以是放在C/C++賦值操作右邊的表達式。所以它可以是一個變量，一個數字，還可以是一個複雜的表達式（比如a+b/c*d）。比如上例可以改爲： __asm__("movl %0, %%db7" : : "a" (foo))，__asm__("movl %0, %%db7" : : "a" (0x1000))或__asm__("movl %0, %%db7" : : "a" (va*vb/vc))。

引號號中的部分是約束部分，和輸出表達式約束不同的是，它不允許指定加號(+)約束和等號(=)約束，也就是說它只能是默認的Read-Only的。約束中必須指定一個寄存器約束，例中的字母a表示當前輸入變量cpu->db7要通過寄存器eax輸入到當前內聯彙編中。

我們看一個例子：

$ cat example4.c

int main(int __argc, char* __argv[])
{
int cr0 = 5;

__asm__ __volatile__("movl %0, %%cr0"::"a" (cr0));

return 0;
}

$ gcc -S example4.c

$ cat example4.s

main:
pushl %ebp
movl %esp, %ebp
subl $4, %esp
movl $5, -4(%ebp) # cr0 = 5
movl -4(%ebp), %eax # %eax = cr0
#APP
movl %eax, %cr0
#NO_APP
movl $0, %eax
leave
ret

我們從編譯出的彙編代碼可以看到，在"Instruction List"之前，GCC按照我們的輸入約束"a"，將變量cr0的內容裝入了eax寄存器。

3. Operation Constraint

每一個Input和Output表達式都必須指定自己的操作約束Operation Constraint，我們這裏來討論在80386平臺上所可能使用的操作約束。

1、寄存器約束

當你當前的輸入或輸入需要藉助一個寄存器時，你需要爲其指定一個寄存器約束。你可以直接指定一個寄存器的名字，比如：

__asm__ __volatile__("movl %0, %%cr0"::"eax" (cr0));

也可以指定一個縮寫，比如：

__asm__ __volatile__("movl %0, %%cr0"::"a" (cr0));

如果你指定一個縮寫，比如字母a，則GCC將會根據當前操作表達式中C/C++表達式的寬度決定使用%eax，還是%ax或%al。比如：

unsigned short __shrt;

__asm__ ("mov %0，%%bx" : : "a"(__shrt));

由於變量__shrt是16-bit short類型，則編譯出來的彙編代碼中，則會讓此變量使用%ex寄存器。編譯結果爲：

movw -2(%ebp), %ax # %ax = __shrt
#APP
movl %ax, %bx
#NO_APP

無論是Input，還是Output操作表達式約束，都可以使用寄存器約束。

下表中列出了常用的寄存器約束的縮寫。

約束 Input/Output 意義
r I,O 表示使用一個通用寄存器，由GCC在%eax/%ax/%al, %ebx/%bx/%bl, %ecx/%cx/%cl, %edx/%dx/%dl中選取一個GCC認爲合適的。
q I,O 表示使用一個通用寄存器，和r的意義相同。
a I,O 表示使用%eax / %ax / %al
b I,O 表示使用%ebx / %bx / %bl
c I,O 表示使用%ecx / %cx / %cl
d I,O 表示使用%edx / %dx / %dl
D I,O 表示使用%edi / %di
S I,O 表示使用%esi / %si
f I,O 表示使用浮點寄存器
t I,O 表示使用第一個浮點寄存器
u I,O 表示使用第二個浮點寄存器

2、內存約束
如果一個Input/Output操作表達式的C/C++表達式表現爲一個內存地址，不想藉助於任何寄存器，則可以使用內存約束。比如：

__asm__ ("lidt %0" : "=m"(__idt_addr)); 或 __asm__ ("lidt %0" : :"m"(__idt_addr));

我們看一下它們分別被放在一個C源文件中，然後被GCC編譯後的結果：

$ cat example5.c

// 本例中，變量sh被作爲一個內存輸入

int main(int __argc, char* __argv[])
{
char* sh = (char*)&__argc;

__asm__ __volatile__("lidt %0" : : "m" (sh));

return 0;
}

$ gcc -S example5.c

$ cat example5.s

main:
pushl %ebp
movl %esp, %ebp
subl $4, %esp
leal 8(%ebp), %eax
movl %eax, -4(%ebp) # sh = (char*) &__argc
#APP
lidt -4(%ebp)
#NO_APP
movl $0, %eax
leave
ret

$ cat example6.c

// 本例中，變量sh被作爲一個內存輸出

int main(int __argc, char* __argv[])
{
char* sh = (char*)&__argc;

__asm__ __volatile__("lidt %0" : "=m" (sh));

return 0;
}

$ gcc -S example6.c

$ cat example6.s

main:
pushl %ebp
movl %esp, %ebp
subl $4, %esp
leal 8(%ebp), %eax
movl %eax, -4(%ebp) # sh = (char*) &__argc
#APP
lidt -4(%ebp)
#NO_APP
movl $0, %eax
leave
ret
首先，你會注意到，在這兩個例子中，變量sh沒有藉助任何寄存器，而是直接參與了指令lidt的操作。

其次，通過仔細觀察，你會發現一個驚人的事實，兩個例子編譯出來的彙編代碼是一樣的！雖然，一個例子中變量sh作爲輸入，而另一個例子中變量sh作爲輸出。這是怎麼回事？

原來，使用內存方式進行輸入輸出時，由於不借助寄存器，所以GCC不會按照你的聲明對其作任何的輸入輸出處理。GCC只會直接拿來用，究竟對這個C/C++表達式而言是輸入還是輸出，完全依賴與你寫在"Instruction List"中的指令對其操作的指令。

由於上例中，對其操作的指令爲lidt，lidt指令的操作數是一個輸入型的操作數，所以事實上對變量sh的操作是一個輸入操作，即使你把它放在 Output域也不會改變這一點。所以，對此例而言，完全符合語意的寫法應該是將sh放在Input域，儘管放在Output域也會有正確的執行結果。

所以，對於內存約束類型的操作表達式而言，放在Input域還是放在Output域，對編譯結果是沒有任何影響的，因爲本來我們將一個操作表達式放在 Input域或放在Output域是希望GCC能爲我們自動通過寄存器將表達式的值輸入或輸出。既然對於內存約束類型的操作表達式來說，GCC不會自動爲它做任何事情，那麼放在哪兒也就無所謂了。但從程序員的角度而言，爲了增強代碼的可讀性，最好能夠把它放在符合實際情況的地方。

約束 Input/Output 意義
m I,O 表示使用系統所支持的任何一種內存方式，不需要藉助寄存器

GCC asm例子

Mini2440啓動代碼的編寫（裸奔）

STM32通用定時器

關於ARM9協處理器CP15及MCR和MRC指令

GCC asm例子

記錄

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結