原文地址:http://www.groad.net/bbs/read.php?tid-3090.html
U-boot 版本:1.2.0
在 U-boot 的 cpu/arm920t/start.S 裏有一處代碼爲 .balignl 16 0xdeadbeef ,初一看不知道意欲何爲,但從僞指令 .balignl 來看,實際上就是對齊。對於某些處理器來說,所編寫的代碼不對齊並不會報錯,但編譯器爲了優化,也可能會自動幫你對齊。但對於另外一些處理器的編譯器來說,彙編代碼裏必須手動保持對齊,否則編譯器會報錯,像上面 ARM 處理器就是如此。
比如我們有一小段彙編代碼:
- _start:
- b reset
- nop
- .byte 0xff
- reset:
- ldr r0, =0x40000000
首先說明一點,在 ARM 中,指令時要求是 32 位對齊的。從上面的代碼來看,b reset 這條爲 4 個字節,但接下來的 .byte 0xff 定義會讓對齊失效。我們用 linux 上的交叉編譯器來編譯,也能看出來:
[root@centos ARM]# arm-linux-as align.s -o aslign.o
align.s: Assembler messages:
align.s:3: Error: misaligned branch destination
這裏的編譯器版本是:
[root@centos ARM]# arm-linux-as --version
GNU assembler (GNU Binutils) 2.20
需要注意的是,有些編譯器並不會報錯(往往版本較爲老些),而是它幫你做了優化,幫助你對齊。
這裏,爲了對齊,我們可以手動修改代碼爲:
_start:
b reset
nop
.byte 0xff
.align
reset:
ldr r0, =0x40000000
這樣,編譯就不會出錯了! 接下來,使用 arm-linux-objdump 來看一下反彙編代碼:
[root@centos ARM]# arm-linux-objdump -d aslign.o
aslign.o: file format elf32-littlearm
Disassembly of section .text:
00000000 <_start>:
0: ea000001 b c
4: e1a00000 nop ; (mov r0, r0)
8: ff .byte 0xff
9: 00 .byte 0x00
...
0000000c :
c: e3a00101 mov r0, #1073741824 ; 0x40000000
從上面可以看到,最後一跳指令所在地址 0xc 是 4 字節對其的。從地址 0x8 開始,依次存放了 .byte 0xff , .byte 0x00, .byte 0x00, .byte 0x00 這 4 個字節,使代碼得到了對齊!
在以前的一些帖子裏也有講過(比如《硬編碼》裏),CPU 對待數據和指令代碼其實是一樣的。基於這個道理,上面依次定義的 4 個字節,湊起來其實也是一條指令,這可以用 arm-linux-objdump 的 -D 參數查看之:
# arm-linux-objdump -D aslign.o
aslign.o: file format elf32-littlearm
Disassembly of section .text:
00000000 <_start>:
0: ea000001 b c
4: e1a00000 nop ; (mov r0, r0)
8: 000000ff strdeq r0, [r0], -pc
0000000c :
c: e3a00101 mov r0, #1073741824 ; 0x40000000
在 ARM920T 處理器中,經過分析上面 strdeq 的指令碼格式,這條指令並不能用,可以說是條虛指令,詳細瞭解見下圖最後的”註釋“說明:
.balignl 是個僞指令,完整的格式爲:
.balign[wl] abs-expr, abs-expr, abs-expr
第一個參數是一個整數的絕對值,表示後面的指令對齊在它的倍數地址上。
第二個參數也是個絕對值讓你指定要填充的指,隨便指定,比如 0x55aa 之類的都可以。此參數可選,如果省略,那麼默認就用 0 來填充了。
第三個參數也是可選的,表示爲了對齊,最大隻能跳過多少個字節;但是如果需要跳過更多的字節,那麼這裏添加的對齊就無效了。
.balignw 和 .balignl 是 .balign 的變體;它們分別表示填充 2 個字節 (word) 及填充 4 個字節 (long word) 。
那麼現在我們修改上面的程序,完完整整的將 .balignl 16 0xdeadbeef 放進去:
- _start:
- b reset
- nop
- .balignl 16, 0xdeadbeef
- reset:
- ldr r0, =0x40000000
查看反彙編:
[root@centos ARM]# arm-linux-objdump -d aslign2.o
aslign2.o: file format elf32-littlearm
Disassembly of section .text:
00000000 <_start>:
0: ea000002 b 10
4: e1a00000 nop ; (mov r0, r0)
8: deadbeef cdple 14, 10, cr11, cr13, cr15, {7}
c: deadbeef cdple 14, 10, cr11, cr13, cr15, {7}
00000010 <reset>:
10: e3a00101 mov r0, #1073741824 ; 0x40000000
14: e1a00000 nop ; (mov r0, r0)
18: e1a00000 nop ; (mov r0, r0)
1c: e1a00000 nop ; (mov r0, r0)
由上可見,填充了 8 個字節數據,也就是 2 個 0xdeadbeef 。這樣, ld r0, =0x40000000 就對齊到 0x10 地址處,0x10 就是 16。
最後順便看一下第三個參數的應用情況:
假如將上面的程序 .balignl 16, 0xdeadbeef 改爲 .balignl 16, 0xdeadbeef, 4 ,那麼反彙編則會看到下面的結果:
[root@centos ARM]# arm-linux-objdump -d aslign2.o
aslign2.o: file format elf32-littlearm
Disassembly of section .text:
00000000 <_start>:
0: ea000000 b 8
4: e1a00000 nop ; (mov r0, r0)
00000008 :
8: e3a00101 mov r0, #1073741824 ; 0x40000000
c: e1a00000 nop ; (mov r0, r0)
因爲指定最大才能跳過 4 個字節來對齊,但是這個 16 字節的對齊需要填充 8 個字節,所以僞指令無效。