交叉編譯器

1. gnueabi相關的兩個交叉編譯器: gnueabi和gnueabihf 
在debian源裏這兩個交叉編譯器的定義如下:
gcc-arm-linux-gnueabi – The GNU C compiler for armel architecture
gcc-arm-linux-gnueabihf – The GNU C compiler for armhf architecture
可見這兩個交叉編譯器適用於armel和armhf兩個不同的架構, armel和armhf這兩種架構在對待浮點運算採取了不同的策略(有fpu的arm才能支持這兩種浮點運算策略)
其實這兩個交叉編譯器只不過是gcc的選項-mfloat-abi的默認值不同. gcc的選項-mfloat-abi有三種值soft,softfp,hard(其中後兩者都要求arm裏有fpu浮點運算單元,soft與後兩者是兼容的,但softfp和hard兩種模式互不兼容):
soft : 不用fpu進行浮點計算,即使有fpu浮點運算單元也不用,而是使用軟件模式。
softfp : armel架構(對應的編譯器爲gcc-arm-linux-gnueabi)採用的默認值,用fpu計算,但是傳參數用普通寄存器傳,這樣中斷的時候,只需要保存普通寄存器,中斷負荷小,但是參數需要轉換成浮點的再計算。
hard : armhf架構(對應的編譯器gcc-arm-linux-gnueabihf)採用的默認值,用fpu計算,傳參數也用fpu中的浮點寄存器傳,省去了轉換, 性能最好,但是中斷負荷高。
把以下測試使用的c文件內容保存成mfloat.c: 
#include <stdio.h>
int main(void)
{
double a,b,c;
a = 23.543;
b = 323.234;
c = b/a;
printf(“the 13/2 = %f\n”, c);
printf(“hello world !\n”);
return 0;
}
1)使用arm-linux-gnueabihf-gcc編譯,使用“-v”選項以獲取更詳細的信息:
# arm-linux-gnueabihf-gcc -v mfloat.c
COLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=hard’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’
-mfloat-abi=hard,可看出使用hard硬件浮點模式。
2)使用arm-linux-gnueabi-gcc編譯:
# arm-linux-gnueabi-gcc -v mfloat.c
COLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=softfp’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’
-mfloat-abi=softfp,可看出使用softfp模式。
2、VFP (vector floating-point)

從ARMv5開始,就有可選的 Vector Floating Point (VFP) 模塊,當然最新的如 Cortex-A8, Cortex-A9Cortex-A5 可以配置成不帶VFP的模式供芯片廠商選擇。
VFP經過若干年的發展,有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16(只使用16個浮點寄存器,默認爲32個)和VFPv3+NEON (如大多數的Cortex-A8芯片) 。對於包含NEON的ARM芯片,NEON一般和VFP公用寄存器。
硬浮點Hard-float
編譯器將代碼直接編譯成發射給硬件浮點協處理器(浮點運算單元FPU)去執行。FPU通常有一套額外的寄存器來完成浮點參數傳遞和運算。
使用實際的硬件浮點運算單元FPU當然會帶來性能的提升。因爲往往一個浮點的函數調用需要幾個或者幾十個時鐘週期。
軟浮點 Soft-float
編譯器把浮點運算轉換成浮點運算的函數調用和庫函數調用,沒有FPU的指令調用,也沒有浮點寄存器的參數傳遞。浮點參數的傳遞也是通過ARM寄存器或者堆棧完成。
現在的Linux系統默認編譯選擇使用hard-float,即使系統沒有任何浮點處理器單元,這就會產生非法指令和異常。因而一般的系統鏡像都採用軟浮點以兼容沒有VFP的處理器。
armel ABI和armhf ABI
在armel中,關於浮點數計算的約定有三種。以gcc爲例,對應的-mfloat-abi參數值有三個:soft,softfp,hard。
soft是指所有浮點運算全部在軟件層實現,效率當然不高,會存在不必要的浮點到整數、整數到浮點的轉換,只適合於早期沒有浮點計算單元的ARM處理器;
softfp是目前armel的默認設置,它將浮點計算交給FPU處理,但函數參數的傳遞使用通用的整型寄存器而不是FPU寄存器;
hard則使用FPU浮點寄存器將函數參數傳遞給FPU處理。
需要注意的是,在兼容性上,soft與後兩者是兼容的,但softfp和hard兩種模式不兼容。
默認情況下,armel使用softfp,因此將hard模式的armel單獨作爲一個abi,稱之爲armhf。
而使用hard模式,在每次浮點相關函數調用時,平均能節省20個CPU週期。對ARM這樣每個週期都很重要的體系結構來說,這樣的提升無疑是巨大的。
在完全不改變源碼和配置的情況下,在一些應用程序上,使用armhf能得到20%——25%的性能提升。對一些嚴重依賴於浮點運算的程序,更是可以達到300%的性能提升。
Soft-float和hard-float的編譯選項
在CodeSourcery gcc的編譯參數上,使用-mfloat-abi=name來指定浮點運算處理方式。-mfpu=name來指定浮點協處理的類型。
可選類型如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。
使用-mfloat-abi=hard (等價於-mhard-float) -mfpu=vfp來選擇編譯成硬浮點。使用-mfloat-abi=softfp就能兼容帶VFP的硬件以及soft-float的軟件實現,運行時的連接器ld.so會在執行浮點運算時對於運算單元的選擇,
是直接的硬件調用還是庫函數調用,是執行/lib還是/lib/vfp下的libm。-mfloat-abi=soft (等價於-msoft-float)直接調用軟浮點實現庫。
在ARM RVCT工具鏈下,定義fpu模式:
–fpu softvfp
–fpu softvfp+vfpv2
–fpu softvfp+vfpv3
–fpu softvfp+vfpv_fp16
–fpu softvfp+vfpv_d16
–fpu softvfp+vfpv_d16_fp16.
定義浮點運算類型
–fpmode ieee_full : 所有單精度float和雙精度double的精度都要和IEEE標準一致,具體的模式可以在運行時動態指定;
–fpmode ieee_fixed : 舍入到最接近的實現的IEEE標準,不帶不精確的異常;
–fpmode ieee_no_fenv :舍入到最接近的實現的IEEE標準,不帶異常;
–fpmode std :非規格數flush到0、舍入到最接近的實現的IEEE標準,不帶異常;
–fpmode fast : 更積極的優化,可能會有一點精度損失。
3、NEON浮點編譯

NEON:SIMD(Single Instruction Multiple Data 單指令多重數據) 指令集, 其針對多媒體和訊號處理程式具備標準化的加速能力。

VFP: (Vector Float Point), 向量浮點運算單元,arm11(s3c6410 支持VFPv2),Cortex-A8(s5pv210)支持VFPv3.

NEON和VFPv3 浮點協處理器共享寄存器組,所以在彙編時,指令是一樣的。

編譯選項:

-mfpu = name(neon or vfpvx)指定FPU 單元

-mfloat-abi = name(soft、hard、 softfp):指定軟件浮點或硬件浮點或兼容軟浮點調用接口

如果只指定 -mfpu,那麼默認編譯不會選擇選擇硬件浮點指令集

如果只指定 -mfloat-abi = hard或者softfp,那麼編譯會使用硬件浮點指令集

測試C文件


[cpp] view plain copy 
 在CODE上查看代碼片派生到我的代碼片
  1. int main(void)  
  2. {  
  3.     float f1, f2, f3;  
  4.     f1 = 1.2;  
  5.     f2 = 1.3;  
  6.     f3 = f1 / f2;  
  7.     return 0;  
  8. }  

1、 arm-eabi-gcc  -S hello.c -mfpu=neon



[cpp] view plain copy 
 在CODE上查看代碼片派生到我的代碼片
  1.     .arch armv5te  
  2.     .fpu softvfp  
  3.     .eabi_attribute 20, 1  
  4.     .eabi_attribute 21, 1  
  5.     .eabi_attribute 23, 3  
  6.     .eabi_attribute 24, 1  
  7.     .eabi_attribute 25, 1  
  8.     .eabi_attribute 26, 2  
  9.     .eabi_attribute 30, 6  
  10.     .eabi_attribute 18, 4  
  11.     .file   "hello.c"  
  12.     .global __aeabi_fdiv  
  13.     .text  
  14.     .align  2  
  15.     .global main  
  16.     .type   main, %function  
  17. main:  
  18.     .fnstart  
  19. .LFB0:  
  20.     @ args = 0, pretend = 0, frame = 16  
  21.     @ frame_needed = 1, uses_anonymous_args = 0  
  22.     stmfd   sp!, {fp, lr}  
  23.     .save {fp, lr}  
  24. .LCFI0:  
  25.     .setfp fp, sp, #4  
  26.     add fp, sp, #4  
  27. .LCFI1:  
  28.     .pad #16  
  29.     sub sp, sp, #16  
  30. .LCFI2:  
  31.     ldr r3, .L3 @ float  
  32.     str r3, [fp, #-16]  @ float  
  33.     ldr r3, .L3+4   @ float  
  34.     str r3, [fp, #-12]  @ float  
  35.     ldr r0, [fp, #-16]  @ float  
  36.     ldr r1, [fp, #-12]  @ float  
  37.     bl  __aeabi_fdiv  
  38.     mov r3, r0  
  39.     str r3, [fp, #-8]   @ float  
  40.     mov r3, #0  
  41.     mov r0, r3  
  42.     sub sp, fp, #4  
  43.     ldmfd   sp!, {fp, pc}  
  44. .L4:  
  45.     .align  2  
  46. .L3:  
  47.     .word   1067030938  
  48.     .word   1067869798  
  49. .LFE0:  
  50.     .fnend  
  51.     .size   main, .-main  
  52.     .ident  "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"  
  53.     .section    .note.GNU-stack,"",%progbits  

2、 arm-eabi-gcc  -S hello.c -mfpu=vfp


[cpp] view plain copy 
 在CODE上查看代碼片派生到我的代碼片
  1.     .arch armv5te  
  2.     .fpu softvfp  
  3.     .eabi_attribute 20, 1  
  4.     .eabi_attribute 21, 1  
  5.     .eabi_attribute 23, 3  
  6.     .eabi_attribute 24, 1  
  7.     .eabi_attribute 25, 1  
  8.     .eabi_attribute 26, 2  
  9.     .eabi_attribute 30, 6  
  10.     .eabi_attribute 18, 4  
  11.     .file   "hello.c"  
  12.     .global __aeabi_fdiv  
  13.     .text  
  14.     .align  2  
  15.     .global main  
  16.     .type   main, %function  
  17. main:  
  18.     .fnstart  
  19. .LFB0:  
  20.     @ args = 0, pretend = 0, frame = 16  
  21.     @ frame_needed = 1, uses_anonymous_args = 0  
  22.     stmfd   sp!, {fp, lr}  
  23.     .save {fp, lr}  
  24. .LCFI0:  
  25.     .setfp fp, sp, #4  
  26.     add fp, sp, #4  
  27. .LCFI1:  
  28.     .pad #16  
  29.     sub sp, sp, #16  
  30. .LCFI2:  
  31.     ldr r3, .L3 @ float  
  32.     str r3, [fp, #-16]  @ float  
  33.     ldr r3, .L3+4   @ float  
  34.     str r3, [fp, #-12]  @ float  
  35.     ldr r0, [fp, #-16]  @ float  
  36.     ldr r1, [fp, #-12]  @ float  
  37.     bl  __aeabi_fdiv  
  38.     mov r3, r0  
  39.     str r3, [fp, #-8]   @ float  
  40.     mov r3, #0  
  41.     mov r0, r3  
  42.     sub sp, fp, #4  
  43.     ldmfd   sp!, {fp, pc}  
  44. .L4:  
  45.     .align  2  
  46. .L3:  
  47.     .word   1067030938  
  48.     .word   1067869798  
  49. .LFE0:  
  50.     .fnend  
  51.     .size   main, .-main  
  52.     .ident  "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"  
  53.     .section    .note.GNU-stack,"",%progbits  

可以看到上面兩個例子,使用的是 .fpu softvfp



3、 arm-eabi-gcc  -S hello.c -mfpu=neon -mfloat-abi=hard

[cpp] view plain copy 
 在CODE上查看代碼片派生到我的代碼片
  1.     .arch armv5te  
  2.     .eabi_attribute 27, 3  
  3.     .eabi_attribute 28, 1  
  4.     .fpu neon  
  5.     .eabi_attribute 20, 1  
  6.     .eabi_attribute 21, 1  
  7.     .eabi_attribute 23, 3  
  8.     .eabi_attribute 24, 1  
  9.     .eabi_attribute 25, 1  
  10.     .eabi_attribute 26, 2  
  11.     .eabi_attribute 30, 6  
  12.     .eabi_attribute 18, 4  
  13.     .file   "hello.c"  
  14.     .text  
  15.     .align  2  
  16.     .global main  
  17.     .type   main, %function  
  18. main:  
  19.     .fnstart  
  20. .LFB0:  
  21.     @ args = 0, pretend = 0, frame = 16  
  22.     @ frame_needed = 1, uses_anonymous_args = 0  
  23.     @ link register save eliminated.  
  24.     str fp, [sp, #-4]!  
  25.     .save {fp}  
  26. .LCFI0:  
  27.     .setfp fp, sp, #0  
  28.     add fp, sp, #0  
  29. .LCFI1:  
  30.     .pad #20  
  31.     sub sp, sp, #20  
  32. .LCFI2:  
  33.     flds    s15, .L3  
  34.     fsts    s15, [fp, #-16]  
  35.     flds    s15, .L3+4  
  36.     fsts    s15, [fp, #-12]  
  37.     flds    s14, [fp, #-16]  
  38.     flds    s15, [fp, #-12]  
  39.     fdivs   s15, s14, s15  
  40.     fsts    s15, [fp, #-8]  
  41.     mov r3, #0  
  42.     mov r0, r3  
  43.     add sp, fp, #0  
  44.     ldmfd   sp!, {fp}  
  45.     bx  lr  
  46. .L4:  
  47.     .align  2  
  48. .L3:  
  49.     .word   1067030938  
  50.     .word   1067869798  
  51. .LFE0:  
  52.     .fnend  
  53.     .size   main, .-main  
  54.     .ident  "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"  
  55.     .section    .note.GNU-stack,"",%progbits  

4、 arm-eabi-gcc  -S hello.c -mfpu=neon -mfloat-abi=softfp


[cpp] view plain copy 
 在CODE上查看代碼片派生到我的代碼片
  1.     .arch armv5te  
  2.     .eabi_attribute 27, 3  
  3.     .fpu neon  
  4.     .eabi_attribute 20, 1  
  5.     .eabi_attribute 21, 1  
  6.     .eabi_attribute 23, 3  
  7.     .eabi_attribute 24, 1  
  8.     .eabi_attribute 25, 1  
  9.     .eabi_attribute 26, 2  
  10.     .eabi_attribute 30, 6  
  11.     .eabi_attribute 18, 4  
  12.     .file   "hello.c"  
  13.     .text  
  14.     .align  2  
  15.     .global main  
  16.     .type   main, %function  
  17. main:  
  18.     .fnstart  
  19. .LFB0:  
  20.     @ args = 0, pretend = 0, frame = 16  
  21.     @ frame_needed = 1, uses_anonymous_args = 0  
  22.     @ link register save eliminated.  
  23.     str fp, [sp, #-4]!  
  24.     .save {fp}  
  25. .LCFI0:  
  26.     .setfp fp, sp, #0  
  27.     add fp, sp, #0  
  28. .LCFI1:  
  29.     .pad #20  
  30.     sub sp, sp, #20  
  31. .LCFI2:  
  32.     flds    s15, .L3  
  33.     fsts    s15, [fp, #-16]  
  34.     flds    s15, .L3+4  
  35.     fsts    s15, [fp, #-12]  
  36.     flds    s14, [fp, #-16]  
  37.     flds    s15, [fp, #-12]  
  38.     fdivs   s15, s14, s15  
  39.     fsts    s15, [fp, #-8]  
  40.     mov r3, #0  
  41.     mov r0, r3  
  42.     add sp, fp, #0  
  43.     ldmfd   sp!, {fp}  
  44.     bx  lr  
  45. .L4:  
  46.     .align  2  
  47. .L3:  
  48.     .word   1067030938  
  49.     .word   1067869798  
  50. .LFE0:  
  51.     .fnend  
  52.     .size   main, .-main  
  53.     .ident  "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"  
  54.     .section    .note.GNU-stack,"",%progbits  

5、 arm-eabi-gcc  -S hello.c -mfpu=vfpv3 -mfloat-abi=softfp


[cpp] view plain copy 
 在CODE上查看代碼片派生到我的代碼片
  1.     .arch armv5te  
  2.     .eabi_attribute 27, 3  
  3.     .fpu vfpv3  
  4.     .eabi_attribute 20, 1  
  5.     .eabi_attribute 21, 1  
  6.     .eabi_attribute 23, 3  
  7.     .eabi_attribute 24, 1  
  8.     .eabi_attribute 25, 1  
  9.     .eabi_attribute 26, 2  
  10.     .eabi_attribute 30, 6  
  11.     .eabi_attribute 18, 4  
  12.     .file   "hello.c"  
  13.     .text  
  14.     .align  2  
  15.     .global main  
  16.     .type   main, %function  
  17. main:  
  18.     .fnstart  
  19. .LFB0:  
  20.     @ args = 0, pretend = 0, frame = 16  
  21.     @ frame_needed = 1, uses_anonymous_args = 0  
  22.     @ link register save eliminated.  
  23.     str fp, [sp, #-4]!  
  24.     .save {fp}  
  25. .LCFI0:  
  26.     .setfp fp, sp, #0  
  27.     add fp, sp, #0  
  28. .LCFI1:  
  29.     .pad #20  
  30.     sub sp, sp, #20  
  31. .LCFI2:  
  32.     flds    s15, .L3  
  33.     fsts    s15, [fp, #-16]  
  34.     flds    s15, .L3+4  
  35.     fsts    s15, [fp, #-12]  
  36.     flds    s14, [fp, #-16]  
  37.     flds    s15, [fp, #-12]  
  38.     fdivs   s15, s14, s15  
  39.     fsts    s15, [fp, #-8]  
  40.     mov r3, #0  
  41.     mov r0, r3  
  42.     add sp, fp, #0  
  43.     ldmfd   sp!, {fp}  
  44.     bx  lr  
  45. .L4:  
  46.     .align  2  
  47. .L3:  
  48.     .word   1067030938  
  49.     .word   1067869798  
  50. .LFE0:  
  51.     .fnend  
  52.     .size   main, .-main  
  53.     .ident  "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"  
  54.     .section    .note.GNU-stack,"",%progbits  

6、 arm-eabi-gcc  -S hello.c -mfpu=vfpv3 -mfloat-abi=hard


[cpp] view plain copy 
 在CODE上查看代碼片派生到我的代碼片
  1.     .arch armv5te  
  2.     .eabi_attribute 27, 3  
  3.     .eabi_attribute 28, 1  
  4.     .fpu vfpv3  
  5.     .eabi_attribute 20, 1  
  6.     .eabi_attribute 21, 1  
  7.     .eabi_attribute 23, 3  
  8.     .eabi_attribute 24, 1  
  9.     .eabi_attribute 25, 1  
  10.     .eabi_attribute 26, 2  
  11.     .eabi_attribute 30, 6  
  12.     .eabi_attribute 18, 4  
  13.     .file   "hello.c"  
  14.     .text  
  15.     .align  2  
  16.     .global main  
  17.     .type   main, %function  
  18. main:  
  19.     .fnstart  
  20. .LFB0:  
  21.     @ args = 0, pretend = 0, frame = 16  
  22.     @ frame_needed = 1, uses_anonymous_args = 0  
  23.     @ link register save eliminated.  
  24.     str fp, [sp, #-4]!  
  25.     .save {fp}  
  26. .LCFI0:  
  27.     .setfp fp, sp, #0  
  28.     add fp, sp, #0  
  29. .LCFI1:  
  30.     .pad #20  
  31.     sub sp, sp, #20  
  32. .LCFI2:  
  33.     flds    s15, .L3  
  34.     fsts    s15, [fp, #-16]  
  35.     flds    s15, .L3+4  
  36.     fsts    s15, [fp, #-12]  
  37.     flds    s14, [fp, #-16]  
  38.     flds    s15, [fp, #-12]  
  39.     fdivs   s15, s14, s15  
  40.     fsts    s15, [fp, #-8]  
  41.     mov r3, #0  
  42.     mov r0, r3  
  43.     add sp, fp, #0  
  44.     ldmfd   sp!, {fp}  
  45.     bx  lr  
  46. .L4:  
  47.     .align  2  
  48. .L3:  
  49.     .word   1067030938  
  50.     .word   1067869798  
  51. .LFE0:  
  52.     .fnend  
  53.     .size   main, .-main  
  54.     .ident  "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"  
  55.     .section    .note.GNU-stack,"",%progbits  

從上面可以看到,使用softfp和hard使用的指令集是一樣的,都是硬件浮點, neon和vfp的區別,僅僅體現在.fpu vfpv3和.fpu neon.



7、 arm-eabi-gcc  -S hello.c -mfloat-abi=hard

[cpp] view plain copy 
 在CODE上查看代碼片派生到我的代碼片
  1.     .arch armv5te  
  2.     .eabi_attribute 27, 3  
  3.     .eabi_attribute 28, 1  
  4.     .fpu vfp  
  5.     .eabi_attribute 20, 1  
  6.     .eabi_attribute 21, 1  
  7.     .eabi_attribute 23, 3  
  8.     .eabi_attribute 24, 1  
  9.     .eabi_attribute 25, 1  
  10.     .eabi_attribute 26, 2  
  11.     .eabi_attribute 30, 6  
  12.     .eabi_attribute 18, 4  
  13.     .file   "hello.c"  
  14.     .text  
  15.     .align  2  
  16.     .global main  
  17.     .type   main, %function  
  18. main:  
  19.     .fnstart  
  20. .LFB0:  
  21.     @ args = 0, pretend = 0, frame = 16  
  22.     @ frame_needed = 1, uses_anonymous_args = 0  
  23.     @ link register save eliminated.  
  24.     str fp, [sp, #-4]!  
  25.     .save {fp}  
  26. .LCFI0:  
  27.     .setfp fp, sp, #0  
  28.     add fp, sp, #0  
  29. .LCFI1:  
  30.     .pad #20  
  31.     sub sp, sp, #20  
  32. .LCFI2:  
  33.     flds    s15, .L3  
  34.     fsts    s15, [fp, #-16]  
  35.     flds    s15, .L3+4  
  36.     fsts    s15, [fp, #-12]  
  37.     flds    s14, [fp, #-16]  
  38.     flds    s15, [fp, #-12]  
  39.     fdivs   s15, s14, s15  
  40.     fsts    s15, [fp, #-8]  
  41.     mov r3, #0  
  42.     mov r0, r3  
  43.     add sp, fp, #0  
  44.     ldmfd   sp!, {fp}  
  45.     bx  lr  
  46. .L4:  
  47.     .align  2  
  48. .L3:  
  49.     .word   1067030938  
  50.     .word   1067869798  
  51. .LFE0:  
  52.     .fnend  
  53.     .size   main, .-main  
  54.     .ident  "GCC: (Sourcery G++ Lite 2009q3-67) 4.4.1"  
  55.     .section    .note.GNU-stack,"",%progbits  

當直接使用-mfloat-abi=hard時,會默認使用.fpu vfp硬件浮點。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章