Linux進程調度時機Schedule函數解析

轉自:http://www.linuxdiyf.com/linux/201107/648.html

 

Linux的調度程序是一個叫Schedule()的函數,由它來決定是否要進行進程的切換。而所謂的調度時機則是在什麼情況下執行調度程序。


  主要有一下幾種狀況:


  1、進程狀態轉換的時刻:進程終止、進程睡眠;

  2、當前進程的時間片用完時(current->counter=0);

  3、設備驅動程序

  4、進程從中斷、異常及系統調用返回到用戶態時;


  時機1,進程要調用sleep()或exit()等函數進行狀態轉換,這些函數會主動調用調度程序進行進程調度。


  時機2,由於進程的時間片是由時鐘中斷來更新的,因此,這種情況和時機4是一樣的。


  時機3,當設備驅動程序執行長而重複的任務時,直接調用調度程序。在每次反覆循環中,驅動程序都檢查need_resched的值,如果必要,則調用調度程序schedule()主動放棄CPU。


  時機4,如前所述,不管是從中斷、異常還是系統調用返回,最終都調用ret_from_sys_call(),由這個函數進行調度標誌的檢測,如果必要,則調用調用調度程序。那麼,爲什麼從系統調用返回時要調用調度程序呢?這當然是從效率考慮。從系統調用返回意味着要離開內核態而返回到用戶態,而狀態的轉換要花費一定的時間,因此,在返回到用戶態前,系統把在內核態該處理的事全部做完。


  下面簡單看一下每個時鐘中斷髮生時內核要做的工作,首先對這個最頻繁的調度時機有一個大體瞭解,然後再詳細討論調度程序的具體工作過程。


  每個時鐘中斷(timer interrupt)發生時,由三個函數協同工作,共同完成進程的選擇和切換,它們是:schedule()、do_timer()及ret_form_sys_call()。


  schedule():進程調度函數,由它來完成進程的選擇(調度);

  do_timer():暫且稱之爲時鐘函數,該函數在時鐘中斷服務程序中被調用,是時鐘中斷服務程序的主要組成部分,該函數被調用的頻率就是時鐘中斷的頻率即每秒鐘100次(簡稱100赫茲或100Hz);

  ret_from_sys_call():系統調用返回函數。當一個系統調用或中斷完成時,該函數被調用,用於處理一些收尾工作,例如信號處理、核心任務等等。


  這三個函數是如何協調工作的呢?


  時鐘中斷是一箇中斷服務程序,它的主要組成部分就是時鐘函數do_timer(),由這個函數完成系統時間的更新、進程時間片的更新等工作,更新後的進程時間片counter作爲調度的主要依據。


  在時鐘中斷返回時,要調用函數ret_from_sys_call(),

  在這個函數中有如下幾行:

  cmpl $0, _need_resched

  jne reschedule

  ……

  restore_all:

  RESTORE_ALL

  reschedule:

  call SYMBOL_NAME(schedule)

  jmp ret_from_sys_call


  這幾行的意思很明顯:檢測 need_resched 標誌,如果此標誌爲非0,那麼就轉到reschedule處調用調度程序schedule()進行進程的選擇。調度程序schedule()會根據具體的標準在運行隊列中選擇下一個應該運行的進程。當從調度程序返回時,如果發現又有調度標誌被設置,則又調用調度程序,直到調度標誌爲0,這時,從調度程序返回時由RESTORE_ALL恢復被選定進程的環境,返回到被選定進程的用戶空間,使之得到運行。


  以上就是時鐘中斷這個最頻繁的調度時機。討論這個的主要目的是爲了對時機4有個大致的瞭解。


  最後要說明的是,系統調用返回函數ret_from_sys_call()是從系統調用、異常及中斷返回函數通常要調用的函數,但並不是非得調用,對於那些要經常被響應的和要被儘快處理的中斷請求信號,爲了減少系統開銷,處理完成後並不調用 ret_from_sys_call()(因爲很顯然的,從這些中斷處理程序返回到的用戶空間肯定是那個被中斷的進程,無需重新選擇),並且,它們作的工作要儘可能少,因爲響應的頻率太高了。


  Linux 調度程序和其他的UNIX調度程序不同,尤其是在“nice level”優先級的處理上,與優先權調度(priority高的進程最先運行)不同,Linux用的是時間片輪轉調度(Round Robing),但同時又保證了高優先級的進程運行的既快、時間又長(both sooner and longer)。而標準的UNIX調度程序都用到了多級進程隊列。大多數的實現都用到了二級優先隊列:一個標準隊列和一個實時(“real time”)隊列。一般情況下,如果實時隊列中的進程未被阻塞,它們都要在標準隊列中的進程之前被執行,並且,每個隊列中,“nice level”高的進程先被執行。


  總體上,Linux 調度序程在交互性方面表現很出色,當然了,這是以犧牲一部分“吞吐量”爲代價的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章