ARM處理器關於非對齊存儲的訪問規則

 

ARM 系列處理器是 RISC (Reducded Instruction Set Computing)處理器。很多基於ARM的高效代碼的程序設計策略都源於RISC 處理器。和很多 RISC 處理器一樣,ARM 系列處理器的內存訪問,也要求數據對齊,即存取“字(Word)”數據時要求四字節對齊,地址的bits[1:0]==0b00;存取“半字(Halfwords)”時要求兩字節對齊,地址的bit[0]==0b0;存取“字節(Byte)”數據時要求該數據按其自然尺寸邊界(Natural Size Boundary)定位。
  ARM 編譯程序通常將全局變量對齊到自然尺寸邊界上,以便通過使用 LDR和 STR 指令有效地存取這些變量。這種內存訪問方式與多數 CISC (Complex Instruction Set Computing)體系結構不同,在CISC體系結構下,指令直接存取未對齊的數據。因而,當需要將代碼從CISC 體系結構向 ARM 處理器移植時,內存訪問的地址對齊問題必須予以注意。在RISC體系結構下,存取未對齊數據無論在代碼尺寸或是程序執行效率上,都將付出非常大的代價。
  本文將從以下幾個方面討論在ARM體系結構下的程序設計問題。
  未對齊的數據指針
  C和C++編程標準規定指向某一數據類型的指針,必須和該類型的數據地址對齊方式一致,所以ARM 編譯器期望程序中的 C 指針指向存儲器中字對齊地址,因爲這可使編譯器生成更高效的代碼。
  比如,如果定義一個指向 int 數據類型的指針,用該指針讀取一個字,ARM 編譯器將使用LDR 指令來完成此操作。如果讀取的地址爲四的倍數(即在一個字的邊界)即能正確讀取。但是,如果該地址不是四的倍數,那麼,一條 LDR 指令返回一個循環移位結果,而不是執行真正的未對齊字載入。循環移位結果取決於該地址向對於字的邊界的偏移量和系統所使用的端序(Endianness)。例如,如果代碼要求從指針指向的地址 0x8006 載入數據,即要載入 0x8006、0x8007、0x8008 和 0x8009 四字節的內容。但是,在 ARM 處理器上,這個存取操作載入了0x8004、0x8005、0x8006 和 0x8007 字節的內容。這就是在未對齊的地址上使用指針存取所得到的循環移位結果。
  因而,如果想將指針定義到一個指定地址(即該地址爲非自然邊界對齊),那麼在定義該指針時,必須使用 __packed 限定符來定義指針: 例如,
  __packed int *pi; // 指針指向一個非字對其內存地址
  使用了_packed限定符限定之後,ARM 編譯器將產生字節存取命令(LDRB或STRB指令)來存取內存,這樣就不必考慮指針對齊問題。所生成的代碼是字節存取的一個序列,或者取決於編譯選項、跟變量對齊相關的移位和屏蔽。但這會導致系統性能和代碼密度的損失。
  值得注意的是,不能使用 __packed 限定的指針來存取存儲器映射的外圍寄存器,因爲 ARM 編譯程序可使用多個存儲器存取來獲取數據。因而,可能對實際存取地址附近的位置進行存取,而這些附近的位置可能對應於其它外部寄存器。當使用了位字段(Bitfield)時, ARM 程序將訪問整個結構體,而非指定字段。

 

在ARM中,通常希望字單元的地址是字對齊的(地址的低兩位爲0b00),半字單元的地址是半字對齊的(地址的最低爲0b0).在存儲訪問操作中,如果存儲單元的地址沒有遵守上述的對齊規則,則稱爲非對齊(unaligned)的存儲訪問操作.

       轉載自:ARM開發板|嵌入式開發http://armdmc.woku.com/article/5018028.html

 

 

———————————————— END ————————————————

 

 

1.非對齊指令的預取操作
當處理器處於ARM狀態器件,如果寫入到寄存器PC中的值是非字對齊的(低兩位不爲0b00),要麼指令執行的結果不可預知,要麼地址值中最低兩位被忽略;
當處理器處於Thumb狀態器件,如果寫入到寄存器PC中的值是非半字對齊的(最低位不爲0b0),要麼指令執行的結果不可預知,要麼的重地值中最低位被忽略.
如果系統中指定,當發生非對齊的指令預取操作時,忽略地址值中相應的位,則有存儲系統實現這種忽略”.也就是說,這時該地址值原封不動的送到存儲系統.
2.非對齊的數據訪問操作
對於Load/Store操作,如果是非對齊的數據訪問操作,系統定義了下面3種可能的結果.
<1>執行的結果不可預知.
<2>忽略字單元地址的低兩位,即訪問地址爲(address _and 0xffffffc)的字單元;忽略半字單元地址的最低位的值,即訪問地址位(address _and 0xffffffe)的半字單元.
<3>忽略字單元地址值種的低兩位的值;忽略半字單元地址的最低位的值.有存儲體統實現這種”忽略”.也就是說,這時該地址值原封不動的送到存儲系統.arm開發板
當發生非對齊的數據訪問時,到底採用上述3種處理方法種的哪一種,是有各指令指定的.
arm指令預取和自修改代碼
        在ARM中允許指令預取.在CPU執行當前指令的同時,可以從存儲器種預取出若干條指令,具體預取多少條指令,不同的ARM實現種有不同的數值.
       預取的指令並不一定能得到執行。比如當前指令完成後,如果發生了異常中斷,程序將會跳轉到異常中斷處理程序處執行,當前預取的指令將被拋棄.或者如果執行了跳轉指令,則當前預取的指令也將被拋棄.
        正如在不同的ARM嵌入式開發實現預取的指令條數可能不同,當發生程序跳轉是,不同的ARM實現種採用的跳轉預測算法也可能不同.

 

        自修改代碼指的是代碼在執行過程種可能修改自身.對於支持指令預取的ARM系統,自修改代碼可能帶來潛在的問題.當指令被預取後,在該指令被執行前,如果有數據訪問指令修改了位於主存種的該指令,這是被預取的指令和主存種對應的指令不同,從而可能使執行的結果發生錯誤.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章