μC/OS的任務調度實現方法及其在PowerPC上的優化

y = OSUnMapTbl[OSRdyGrp];

  SPrioHighRdy = (INT8U)((y << 3) + OSUnMapTbl[OSRdyTbl[y]]);

  μC/OS的任務調度算法採用了以空間換時間的策略,將特定字節值的最低位1所在位的信息預先計算並保存到表中,運行時通過查錶快速得到;每個任務的TCB中除了保存優先級信息本身外,還使用額外的4個字節保存優先級的高低3位和對應的OSUnMapTbl值,以避免運行時實時計算這幾個值所帶來的延遲。這些措施增加了系統ROM和RAM的開銷。

  3 利用PowerPC“數出前導零數目”指令實現任務調度

  PowerPC是Motorola 、IBM和Apple三家公司於20世紀90年代初期聯合設計的32位CPU。Freescale(其前身是Motorola半導體部)發展了針對汽車電子的MPC5xx系列單片機及後續基於e200內核的MPC5xxx系列單片機;更高端的e500、e600內核是用於通信領域的MPC6xxx、7xxx和8xxx系列。

  下面對μC/OS任務優先級調度算法的改進和優化是在MPC5554單片機上實現的。

  PowerPC處理器具有一條“數出前導零數目” 的指令cntlzw(count leading zero word),可以以硬件指令方式實現優先級的多任務調度算法。這條指令也可用於圖像處理和算法加密的場合。該指令數出一個32位寄存器中前置零的數目,例如,返回0表示b0不爲零,即沒有前導零;返回3表示b3不爲零,b3位的前面從b0到b2共有3個零;返回32表示RS寄存器中所有的位都爲零。(在PowerPC架構中,最高位MSB表示爲b0,低位MSB根據位寬表示爲b7、b15或b31。)

  利用這條指令,用匯編語言改寫尋找最高優先級的就緒任務的函數,則不需要進行循環移位判斷,可以直接從64個任務中找出優先級最高的那個任務。代碼如下:

  asm INT8U FindHighestRdyTask(void){

  lisr5,OSRdyTbl@ha//讓r5寄存器指向OSRdyTbl[]

  orir5,r5,OSRdyTbl@l

  lwzr3,0(r5)//將OSRdyTbl[0]的值載入r3寄存器

  cntlzwr3,r3//計算OSRdyTbl[0]中前導零數目

  cmpi0,0,r3,32//判斷前32個任務是否就緒

  bne __FindEnd//如果前導零數目爲32,說明前32個任務均未就緒,需要從後32個任務中尋找

  lwzr4,4(r5)//將OSRdyTbl[1]的值載入r4寄存器

  cntlzwr4,r4//計算OSRdyTbl[1]的前導零數目

  addir3,r4,32//後32個任務需要加上偏移量

  __FindEnd:

  blr //返回值保存在r3寄存器中

  }

  在這段代碼中,首先判斷前32個任務是否有處於就緒態的,如果沒有的話,再對後32個任務進行判斷。由於優先級最低的空閒任務總是處於就緒態,所以後32個任務總能返回一個有效值。該代碼在前32個任務有就緒態時運行7條指令,在前32個任務均沒有就緒時需要執行10條指令;而μC/OS原有的代碼編譯出來的彙編程序,則需要運行15條指令。

  使用這個方法的另一個好處是不再需要使用256字節的OSUnMapTbl表,任務控制塊TCB也不需要使用OSTCBX、OSTCBY和OSTCBBitY、OSTCBBitX變量,每個ECB中也不再需要OSRdyGrp,這也減少了對ROM和RAM的佔用。

  4 改進擴展任務數的優先級調度性能

  當對μC/OSII支持的任務數進行擴展時,按照μC/OSII原有的做法,需要按照高低字節分別查找OSUnMapTbl對照表。任務數爲256時,尋找最高優先級就緒任務的函數將需要運行約35條指令。數出前導零數目的指令在這種情況下的作用將更加顯著,對於32位PowerPC處理器,精心設計的代碼可以做到僅需10條指令就將任務數擴展到1024個。

  此時OSRdyGrp擴展爲32位,OSrdyTbl擴展成32個32位的數組。從OSRdyGrp得到的前導零數目,就是任務優先級高5位的值,乘以4可以得到該字的相對偏移地址;在OSRdyTbl中,定義高位對應高優先級任務,低位對應低優先級任務,則其前導零數目就是任務優先級低5位的值,和高5位的值移位相加就得到完整的任務優先級。通過將OSRdyGrp和OSRdyTbl定義成結構體,利用結構體首地址的相對尋址來分別讀取其數值,可以減少一次取地址的操作。

  尋找最高優先級就緒態的最終代碼如下:

  typedef struct {//定義結構體

  INT32U Tbl[32];

  INT32U Grp;

  } OSTaskRdyBlock;

  OSTaskRdyBlock OSRdy;//定義全局變量OSRdy

  asm INT16U FindHighestRdyTask(void){

  lisr5,OSRdy@ha//將OSRdy結構體指針載入r5寄存器

  orir5,r5,OSRdy@l

  lwzr3,128(r5)//OSRdy.Grp在結構體中具有固定偏移量

  cntlzwr3,r3//數出OSRdyGrp的前導零數目

  slwir6,r3,2//得到OSRdyTbl的地址偏移量

  lwzxr4,r6,r5//通過結構體指針,讀取OSRdy.Tbl的對應字

  cntlzwr4,r4//計算OSRdyTbl對應字的前導零數目

  slwir3,r3,5//任務優先級高5位移位

  addr3,r4,r3//和優先級低5位相加,得到完整優先級

  blr//返回

  }

  在64位的PowerPC 更有cntlzd(Count Leading Zero Double word)指令,一次就可以找出64個任務中優先級最高的那個,就更沒有必要使用μC/OSII中的算法了。

  5 總結

  RTOS實時內核μC/OS和μC/OSII中,任務調度算法巧妙,性能優異,在嵌入式應用領域很有影響力,被移植到各種CPU上。然而由於是爲8位CPU設計的,對於那些具有優先級硬件算法指令的16/32/64位CPU,μC/OSII的軟件算法就完全失去了優勢。應該利用這類CPU的特有指令,優化任務調度算法,使RTOS的實時性達到最佳。對於這類處理器,僅移植μC/OSII軟件算法是很不夠的,應該利用相關硬件算法指令。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章