內嵌彙編簡介（在C++中嵌入彙編語句）

爲了加速遊戲，一提起彙編語言，大家也許會感到很神祕。其實如果你學起來就會發現，它並非想象中那樣難。特別是內嵌彙編，由於它和C++緊密結合，使你不必考慮很多煩瑣的細節（例如輸入輸出函數的寫法），學習起來比較容易。使用內嵌彙編，特別是使用MMX指令，可以大大提高各種遊戲中常見特效的速度，對於編出一個漂亮的遊戲非常重要。學好彙編語言還有一個特別有趣的用處：可以觀察和看懂VC++生成的彙編代碼，從而更好地瞭解C++語言本身和優化代碼。

6.1 內嵌彙編簡介
在高級語言中，我們可以無所顧忌地使用各種語句，再由編譯器將語句經過非常複雜的編譯過程將其轉換爲機器指令後運行。事實上，處理器本身所能處理的指令不多；更糟糕的是，大部分指令不能直接施用在內存中的變量上，要藉助寄存器這個中間存儲單元（你可以把寄存器看做是一個變量）。Pentium級處理器的寄存器不多，只有8個32位通用寄存器，分別被稱爲EAX, EBX, ECX, EDX, EBP, ESP, EDI , ESI。每一個通用寄存器的低16位又分別被稱爲AX, BX, CX, DX, BP, SP, DI , SI。其中AX, BX, CX, DX的高8位被稱爲AH, BH, CH, DH；低8位被稱爲AL, BL, CL, DL。注意在內嵌彙編中不應使用EBP和ESP，它們存儲着重要的堆棧信息。
還有一個非常重要的寄存器，叫做標誌寄存器(EFLAGS)，標明瞭運算結果的各個屬性，你不能直接讀取或修改它。這些屬性有：不溢出/溢出(OF)、正/負(SF)、非零/零(ZF)、偶/奇(PF)、不進位/進位(CF)等。
彙編語言中若要表示有符號整數，需先寫出該整數的絕對值的二進制形式，若此數爲正數或零則已得到結果，否則將其取反(0->1，1->0)後再加上一即爲結果。所以一個8位寄存器可表示的有符號整數範圍爲從-128到127。
與C++類似，彙編語言提供了得到指針所指內存的方法，這被稱爲"尋址"。用法很簡單，象這樣：[寄存器+寄存器*1/2/4/8+32位立即數]就可以得到這個位置的數了。舉一個例子，如果有一個數組unsigned short A[100]，且EAX中存儲着A[0]的地址，那麼[EAX+58]即爲A[29]的值；如果此時EBX=9，那麼[EAX+EBX*2+4]將是A[11]的值。
那麼又怎麼把一個變量的地址裝載進寄存器呢？後面將會介紹。
內嵌彙編的使用方法是：
_asm
{
語句 //後面可加可不加分號
}
你可以把它插入程序中的任何位置，非常靈活。
6.2 基本指令
基本指令均不影響標誌寄存器。
第一條指令是傳送指令：MOV DEST, SRC。其作用爲將DEST賦以值SRC。其中DEST和SRC可爲整數（稱爲立即數）、變量或[地址](存儲器)，寄存器。需注意的是有的操作是不允許的：在彙編語言中你永遠不能將存儲器或寄存器內容賦給立即數(你見過5=a這樣的語句嗎?)；也不能將存儲器內容直接賦給另一存儲器，必須藉助寄存器作爲中間變量來實現。關於MOV還有一點要注意的是DEST和SRC必須都爲32位/16位/8位，即同一大小。值得特別注意的是，數據在內存中的存儲方式是以字節爲單位顛倒的，即：如果內存地址0000存儲的字節是5F，地址0001存儲的字節是34，地址0002存儲的字節是6A，地址0003存儲的字節是C4，那麼地址0000處存儲的字（WORD，16位）爲345F，雙字（DWORD，32位）爲C46A345F。
第二條指令是地址裝載指令：LEA A, B。其作用爲將B變量的地址裝載進A寄存器(A需爲32位)。要注意的是不能像LEA EAX, Temp[5]這樣直接調數組中某個元素的地址。這個指令還可以用來進行簡單的運算，考慮下面的語句：LEA EAX, [EBX+ECX*4+8]，此語句可將EBX+ECX*4+8的值賦給EAX。
OK，讓我們看一個可以將兩個正整數相加的程序：
#include <iostream>
using namespace std;
//此程序也展示了內嵌彙編應如何使用C++中的指針
void main( )
{
unsigned int a,b;
cin>>a;
cin>>b;
int *c = &a;
__asm //下面是內嵌彙編...
{
mov eax, c; //c中存儲的a的地址->eax
mov eax, [eax]; //a的值->eax
//注意直接mov eax, [c]是錯誤的
mov ebx, b; //可以像這樣直接對ebx賦值
lea eax, [eax+ebx];
mov a, eax; //可以直接將eax的值->a
} //內嵌彙編部分結束...
cout<<a;
}
第三條指令是交換指令，形式爲XCHG A, B。A和B中至少有一個須爲寄存器。如果你想交換兩處內存中的數據則要使用寄存器作爲中間人。
接着是擴展傳送指令，共有兩條，爲MOVSX DEST, SRC和MOVZX DEST, SRC，它們的用處分別是將SRC中的有符號數或無符號數賦給DEST。這時你就可以將字長較短的寄存器的內容賦給字長較長的寄存器，反之則不行。
大家會發現，8個通用寄存器實在無法滿足編程的要求。爲了解決這一矛盾，引入了堆棧這一聰明的設想。你可以把堆棧想象爲一塊放箱子的區域，用入棧(PUSH)可將一個箱子放在現有箱子的最頂端，而出棧(POP)可將現有箱子最頂端的那個箱子取出。看看下面的指令吧：
push eax //eax進棧，堆棧爲eax
push ebx //eax進棧，堆棧爲eax ebx
push ecx //eax進棧，堆棧爲eax ebx ecx
pop ebx //ebx=ecx，堆棧爲eax ebx
pop eax //eax=ebx，堆棧爲eax
pop ecx //ecx=eax，堆棧空
可以看到，堆棧不僅可以方便地暫時存儲數據而且還可以調整他們的次序。

6.3 算術指令
算術指令大都影響標誌寄存器。這些指令比較容易明白，現在將其列出：
表6.1
clc CF=0
stc CF=1
cmc CF=1-CF
add a,b a=a+b (結果過大可能會有古怪的結果，且置CF 1)
adc a,b a=a+b+CF (加上進位)
sub a,b a=a-b (如結果小於0會加上2的16或32次方，且置CF 1)
sbb a,b a=a-b-CF (減去退位)
inc a a++
dec a a- -
neg a a=-a
mul a eax=eax*a後的低32位, edx=高32位例： mov eax,234723 mov edx, 12912189 mul edx; 則eax=2835794967 edx=705
div a eax=(edx eax)/a的商, edx=餘數例： mov eax,12121 mov edx,2 此時(edx eax)=8589946713 mov ebx,121 div ebx; 則eax=70991295 edx=18
imul / idiv dest, src 有符號數乘 / 除法，dest=dest乘 / 除src
imul / idiv dest, s1, s2 有符號數乘 / 除法，dest=s1乘 / 除s2

爲了讓大家弄懂標誌，請看兩段程序(出現的數都爲十六進制數)：
表6.2
指令 CF ZF SF OF PF AX或BX
mov ax, 7896 ? ? ? ? ? 7896
add al, ah 1 0 0 0 0 780e
add ah, al 0 0 1 1 0 860e
add al, f2 1 1 0 0 1 8600
add al, 1234 0 0 1 0 0 9834

mov bx, 9048 ? ? ? ? ? 9048
sub bh, bl 0 0 0 1 1 4848
sub bl, bh 0 1 0 0 1 4800
sub bl, 5 1 0 1 0 0 48fb
sub bx, 8f34 1 0 1 1 0 b9c7

6.4 邏輯與移位指令
邏輯指令會將標誌寄存器中的OF和CF清零。
表6.3
not a a=~a(注意not與neg不同!)
and a, b a=a&b
or a, b a=a|b
xor a, b a=a^b

下面是移位指令，其中x可爲8位立即數或CL寄存器。
表6.4
sal(也可寫成shl) a, x 將a左移x位，CF=移出的那一位數空位用0補足
sar a, x 將有符號a右移x位，CF=移出的那一位數空位按a的符號用0/1補足
shr a, x 將無符號a右移x位，CF=移出的那一位數空位用0補足
rol a, x 將a循環左移(左邊出去的數又從最右邊回來)
ror a, x 將a循環右移(右邊出去的數又從最左邊回來)
rcl / rcr a, x 把CF放在目標最左邊然後循環左/右移
shld a, b, x 將a左移x位, 空出位用b高端m位填充例：shld edx, eax, 16可將eax的高16位放入dx中。
shrd a, b, x 將a右移x位, 空出位用b低端m位填充

6.5 比較、測試、轉移與循環指令
比較與測試指令基本上總是與轉移指令相配合使用，其形式分別爲CMP a, b和TEST a, b。CMP實際上是根據a-b的值改變標誌寄存器但不改變a和b，可以檢測兩個數的大小關係。TEST則是根據a&b的值改變標誌寄存器，同樣不改變a和b。這條指令可以用來測試a中哪些位爲1。執行完這些指令後，立刻用轉移指令就可實現條件轉移，因爲條件轉移語句會根據標誌寄存器決定是否轉移。轉移指令的使用方法就像這樣：
__asm{
_addax: add ax,1; //_addax是標號
jmp _addax;
}
轉移指令有：
JMP 無條件轉移
JE / JZ ZF=1時轉移
JNE / JNZ ZF=0時轉移

JS SF=1時轉移
JNS SF=0時轉移
JO OF=1時轉移
JNO OF=0時轉移
JP / JPE PF=1時轉移
JNP / JPO PF=0時轉移

根據兩無符號數關係轉移：
JA / JNBE 大於時轉移（CF或ZF=0）
JBE / JNA 不大於時轉移（CF或ZF=1）
JB / JNAE / JC 小於時轉移（CF=1）
JNB / JAE / JNC 不小於時轉移（CF=0）

根據兩有符號數關係轉移：
JNLE / JG 大於時轉移（（SF異或OF）或ZF）=0 ）
JLE / JNG 不大於時轉移（（SF異或OF）或ZF）=1 ）
JL / JNGE 小於時轉移（SF異或OF=1）
JNL / JGE 不小於時轉移（SF異或OF=0）

特殊轉移語句：
JECXZ CX=0時轉移

爲了記住這麼多條指令，你只需知道一點，就是無符號數之間的關係分別被稱爲Above，Equal，Below，分別代表大於，等於，小於；有符號數之間相應的關係則分別被稱爲Great，Equal，Less。
事實上，有些轉移是可以避免的。舉個例子，要算一個數的絕對值是否要用轉移呢？請看一段程序：
MOV EDX,EAX
SAR EDX,31 //EDX現在全爲EAX的符號位
XOR EAX,EDX
SUB EAX,EDX

找出兩個數中較大的一個應該要用轉移吧？不過也可以象下面的解決方案那樣利用標誌，真是絕了：
SUB EBX,EAX
SBB ECX,ECX //如果EBX≥EAX，現在ECX=0，否則ECX=FFFFFFFF
AND ECX,EBX
ADD EAX,ECX

下面的一段程序實現了if (a != 0) a = b; else a = c;
CMP EAX,1
SBB EAX,EAX
XOR ECX,EBX
AND EAX,ECX
XOR EAX,EBX

循環語句常用的是LOOP，它等價於DEC CX加上JNZ。

下面看一個彙編的綜合運用：冒泡排序。
#include <iostream>
using namespace std;

#define array_size 10

int a[array_size]={42, 73, 65, 97, 23, 59, 18, 84, 36, 6};

void main()
{
int *p;
p=&a[0];
p--;

__asm
{
mov esi,p;
mov ecx,array_size;
_outloop:
mov edx,ecx;
_inloop:
mov eax, [ esi+ecx*4 ]; //一個int佔4字節
mov ebx, [ esi+edx*4 ];
cmp eax, ebx;
jnb _noxchg; //不交換
mov [ esi+ecx*4 ], ebx;
mov [ esi+edx*4 ], eax;
_noxchg:
dec edx;
jnz _inloop;
loop _outloop;
}

for (int i=0;i<10;i++)
cout<<a[i]<<" ";
}

內嵌彙編簡介（在C++中嵌入彙編語句）

關於接口協議，你必須要知道這些！

一鍵自動化博客發佈工具,用過的人都說好(頭條篇)

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

京東面試：如何進行JVM調優？

01 穩定性（一）如何應對事故並做好覆盤？

線程池那些坑爹的參數-核心線程數&最大線程數&工作隊列

Stream流常用方法總結

D3D9學習筆記(九) effect （hlsl）

Linux 文件系統(一)---虛擬文件系統VFS----超級塊、inode、dentry、file

dx HLSL編程

JavaScript引擎研究總結與C、C++與互調用

windows消息和消息隊列二

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結