.balignl的意義

原文地址:http://www.groad.net/bbs/read.php?tid-3090.html

U-boot 版本:1.2.0


在 U-boot 的 cpu/arm920t/start.S 裏有一處代碼爲 .balignl 16 0xdeadbeef  ,初一看不知道意欲何爲,但從僞指令 .balignl 來看,實際上就是對齊。對於某些處理器來說,所編寫的代碼不對齊並不會報錯,但編譯器爲了優化,也可能會自動幫你對齊。但對於另外一些處理器的編譯器來說,彙編代碼裏必須手動保持對齊,否則編譯器會報錯,像上面 ARM 處理器就是如此。

比如我們有一小段彙編代碼:
  1. _start:
  2.         b reset
  3.         nop
  4.         .byte 0xff
  5. reset:
  6.         ldr r0, =0x40000000

首先說明一點,在 ARM 中,指令時要求是 32 位對齊的。從上面的代碼來看,b reset 這條爲 4 個字節,但接下來的 .byte 0xff 定義會讓對齊失效。我們用 linux 上的交叉編譯器來編譯,也能看出來:
[root@centos ARM]# arm-linux-as align.s -o aslign.o
align.s: Assembler messages:
align.s:3: Error: misaligned branch destination

這裏的編譯器版本是:
[root@centos ARM]# arm-linux-as --version
GNU assembler (GNU Binutils) 2.20

需要注意的是,有些編譯器並不會報錯(往往版本較爲老些),而是它幫你做了優化,幫助你對齊。

這裏,爲了對齊,我們可以手動修改代碼爲:
_start:
        b reset
        nop
        .byte 0xff
        .align
reset:
        ldr r0, =0x40000000

這樣,編譯就不會出錯了! 接下來,使用 arm-linux-objdump 來看一下反彙編代碼:
[root@centos ARM]# arm-linux-objdump -d aslign.o

aslign.o:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:   ea000001        b       c 
   4:   e1a00000        nop                     ; (mov r0, r0)
   8:   ff                 .byte   0xff
   9:   00              .byte   0x00
       ...

0000000c :
   c:   e3a00101        mov     r0, #1073741824 ; 0x40000000

從上面可以看到,最後一跳指令所在地址 0xc 是 4 字節對其的。從地址 0x8 開始,依次存放了 .byte 0xff , .byte 0x00, .byte 0x00, .byte 0x00 這 4 個字節,使代碼得到了對齊!

在以前的一些帖子裏也有講過(比如《硬編碼》裏),CPU 對待數據和指令代碼其實是一樣的。基於這個道理,上面依次定義的 4 個字節,湊起來其實也是一條指令,這可以用 arm-linux-objdump 的 -D 參數查看之:
# arm-linux-objdump -D aslign.o

aslign.o:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:   ea000001        b       c 
   4:   e1a00000        nop                     ; (mov r0, r0)
8:   000000ff        strdeq  r0, [r0], -pc

0000000c :
   c:   e3a00101        mov     r0, #1073741824 ; 0x40000000

在 ARM920T 處理器中,經過分析上面 strdeq 的指令碼格式,這條指令並不能用,可以說是條虛指令,詳細瞭解見下圖最後的”註釋“說明:


.balignl 是個僞指令,完整的格式爲:
.balign[wl] abs-expr, abs-expr, abs-expr

第一個參數是一個整數的絕對值,表示後面的指令對齊在它的倍數地址上。
第二個參數也是個絕對值讓你指定要填充的指,隨便指定,比如 0x55aa 之類的都可以。此參數可選,如果省略,那麼默認就用 0 來填充了。
第三個參數也是可選的,表示爲了對齊,最大隻能跳過多少個字節;但是如果需要跳過更多的字節,那麼這裏添加的對齊就無效了。

.balignw 和 .balignl 是 .balign 的變體;它們分別表示填充 2 個字節 (word) 及填充 4 個字節 (long word) 。

那麼現在我們修改上面的程序,完完整整的將 .balignl 16 0xdeadbeef 放進去:
  1. _start:
  2.         b reset
  3.         nop
  4.         .balignl 16, 0xdeadbeef
  5. reset:
  6.         ldr r0, =0x40000000

查看反彙編:
[root@centos ARM]# arm-linux-objdump -d aslign2.o

aslign2.o:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:   ea000002        b       10 
   4:   e1a00000        nop                     ; (mov r0, r0)
   8:   deadbeef        cdple   14, 10, cr11, cr13, cr15, {7}
   c:   deadbeef        cdple   14, 10, cr11, cr13, cr15, {7}
00000010 <reset>:
  10:   e3a00101        mov     r0, #1073741824 ; 0x40000000
  14:   e1a00000        nop                     ; (mov r0, r0)
  18:   e1a00000        nop                     ; (mov r0, r0)
  1c:   e1a00000        nop                     ; (mov r0, r0)

由上可見,填充了 8 個字節數據,也就是 2 個 0xdeadbeef 。這樣, ld r0, =0x40000000 就對齊到 0x10 地址處,0x10 就是 16。

最後順便看一下第三個參數的應用情況:
假如將上面的程序  .balignl 16, 0xdeadbeef 改爲  .balignl 16, 0xdeadbeef, 4 ,那麼反彙編則會看到下面的結果:
[root@centos ARM]# arm-linux-objdump -d aslign2.o

aslign2.o:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:   ea000000        b       8 
   4:   e1a00000        nop                     ; (mov r0, r0)

00000008 :
   8:   e3a00101        mov     r0, #1073741824 ; 0x40000000
   c:   e1a00000        nop                     ; (mov r0, r0)

因爲指定最大才能跳過 4 個字節來對齊,但是這個 16 字節的對齊需要填充 8 個字節,所以僞指令無效。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章