|
|
來源: ChinaUnix博客 日期: 2008.01.23 20:30 (共有0條評論) 我要評論 | |
1. 調度數據成員 (1) volatile long states; 表示進程的當前狀態: ? TASK_RUNNING:正在運行或在就緒隊列run-queue中準備運行的進程,實際參與進程調度。 ? TASK_INTERRUPTIBLE:處於等待隊列中的進程,待資源有效時喚醒,也可由其它進程通過信號(signal)或定時中斷喚醒後進入就緒隊列run-queue。 ? TASK_UNINTERRUPTIBLE:處於等待隊列中的進程,待資源有效時喚醒,不可由其它進程通過信號(signal)或定時中斷喚醒。 ? TASK_ZOMBIE:表示進程結束但尚未消亡的一種狀態(僵死狀態)。此時,進程已經結束運行且釋放大部分資源,但尚未釋放進程控制塊。 ?TASK_STOPPED:進程被暫停,通過其它進程的信號才能喚醒。導致這種狀態的原因有二,或者是對收到SIGSTOP、SIGSTP、SIGTTIN或SIGTTOU信號的反應,或者是受其它進程的ptrace系統調用的控制而暫時將CPU交給控制進程。 ? TASK_SWAPPING: 進程頁面被交換出內存的進程。 (2) unsigned long flags; 進程標誌: ?PF_ALIGNWARN 打印“對齊”警告信息。 ?PF_PTRACED 被ptrace系統調用監控。 ?PF_TRACESYS 正在跟蹤。 ?PF_FORKNOEXEC 進程剛創建,但還沒執行。 ?PF_SUPERPRIV 超級用戶特權。 ?PF_DUMPCORE dumped core。 ?PF_SIGNALED 進程被信號(signal)殺出。 ?PF_STARTING 進程正被創建。 ?PF_EXITING 進程開始關閉。 ?PF_USEDFPU 該進程使用FPU(SMP only)。 ?PF_DTRACE delayed trace (used on m68k)。 (3) long priority; 進程優先級。 Priority的值給出進程每次獲取CPU後可使用的時間(按jiffies計)。優先級可通過系統調用sys_setpriorty改變(在kernel/sys.c中)。 (4) unsigned long rt_priority; rt_priority給出實時進程的優先級,rt_priority+1000給出進程每次獲取CPU後可使用的時間(同樣按jiffies計)。實時 進程的優先級可通過系統調用sys_sched_setscheduler()改變(見kernel/sched.c)。 (5) long counter; 在輪轉法調度時表示進程當前還可運行多久。在進程開始運行是被賦爲priority的值,以後每隔一個tick(時鐘中斷)遞減1,減到0時引起新一輪調 度。重新調度將從run_queue隊列選出counter值最大的就緒進程並給予CPU使用權,因此counter起到了進程的動態優先級的作用 (priority則是靜態優先級)。 (6) unsigned long policy; 該進程的進程調度策略,可以通過系統調用sys_sched_setscheduler()更改(見kernel/sched.c)。調度策略有: ?SCHED_OTHER 0 非實時進程,基於優先權的輪轉法(round robin)。 ?SCHED_FIFO 1 實時進程,用先進先出算法。 ?SCHED_RR 2 實時進程,用基於優先權的輪轉法。 2. 信號處理 (1) unsigned long signal; 進程接收到的信號。每位表示一種信號,共32種。置位有效。 (2) unsigned long blocked; 進程所能接受信號的位掩碼。置位表示屏蔽,復位表示不屏蔽。 (3) struct signal_struct *sig; 因爲signal和blocked都是32位的變量,Linux最多隻能接受32種信號。對每種信號,各進程可以由PCB的sig屬性選擇使用自定義的處 理函數,或是系統的缺省處理函數。指派各種信息處理函數的結構定義在include/linux/sched.h中。對信號的檢查安排在系統調用結束後, 以及“慢速型”中斷服務程序結束後(IRQ#_interrupt(),參見9。5節“啓動內核”)。 3. 進程隊列指針 (1) struct task_struct *next_task,*prev_task; 所有進程(以PCB的形式)組成一個雙向鏈表。next_task和就是鏈表的前後指針。鏈表的頭和尾都是init_task(即0號進程)。 (2) struct task_struct *next_run,*prev_run; 由正在運行或是可以運行的,其進程狀態均爲TASK_RUNNING的進程所組成的一個雙向循環鏈表,即run_queue就緒隊列。該鏈表的前後向指針用next_run和prev_run,鏈表的頭和尾都是init_task(即0號進程)。 (3) struct task_struct *p_opptr,*p_pptr;和struct task_struct *p_cptr,*p_ysptr,*p_osptr; 以上分別是指向原始父進程(original parent)、父進程(parent)、子進程(youngest child)及新老兄弟進程(younger sibling,older sibling)的指針。 4. 進程標識 (1) unsigned short uid,gid; uid和gid是運行進程的用戶標識和用戶組標識。 (2) int groups[NGROUPS]; 與多數現代UNIX操作系統一樣,Linux允許進程同時擁有一組用戶組號。在進程訪問文件時,這些組號可用於合法性檢查。 (3) unsigned short euid,egid; euid和egid又稱爲有效的uid和gid。出於系統安全的權限的考慮,運行程序時要檢查euid和egid的合法性。通常,uid等於euid, gid等於egid。有時候,系統會賦予一般用戶暫時擁有root的uid和gid(作爲用戶進程的euid和egid),以便於進行運作。 (4) unsigned short fsuid,fsgid; fsuid和fsgid稱爲文件系統的uid和gid,用於文件系統操作時的合法性檢查,是Linux獨特的標識類型。它們一般分別和euid和egid 一致,但在NFS文件系統中NFS服務器需要作爲一個特殊的進程訪問文件,這時只修改客戶進程的fsuid和fsgid。 (5) unsigned short suid,sgid; suid和sgid是根據POSIX標準引入的,在系統調用改變uid和gid時,用於保留真正的uid和gid。 (6) int pid,pgrp,session; 進程標識號、進程的組織號及session標識號,相關係統調用(見程序kernel/sys.c)有sys_setpgid、sys_getpgid、sys_setpgrp、sys_getpgrp、sys_getsid及sys_setsid幾種。 (7) int leader; 是否是session的主管,布爾量。 5. 時間數據成員 (1) unsigned long timeout; 用於軟件定時,指出進程間隔多久被重新喚醒。採用tick爲單位。 (2) unsigned long it_real_value,it_real_iner; 用於itimer(interval timer)軟件定時。採用jiffies爲單位,每個tick使it_real_value減到0時向進程發信號SIGALRM,並重新置初值。初值由 it_real_incr保存。具體代碼見kernel/itimer.c中的函數it_real_fn()。 (3) struct timer_list real_timer; 一種定時器結構(Linux共有兩種定時器結構,另一種稱作old_timer)。數據結構的定義在include/linux/timer.h中,相關操作函數見kernel/sched.c中add_timer()和del_timer()等。 (4) unsigned long it_virt_value,it_virt_incr; 關於進程用戶態執行時間的itimer軟件定時。採用jiffies爲單位。進程在用戶態運行時,每個tick使it_virt_value減1,減到0 時向進程發信號SIGVTALRM,並重新置初值。初值由it_virt_incr保存。具體代碼見kernel/sched.c中的函數 do_it_virt()。 (5) unsigned long it_prof_value,it_prof_incr; 同樣是itimer軟件定時。採用jiffies爲單位。不管進程在用戶態或內核態運行,每個tick使it_prof_value減1,減到0時向進程 發信號SIGPROF,並重新置初值。初值由it_prof_incr保存。 具體代碼見kernel/sched.c中的函數do_it_prof。 (6) long utime,stime,cutime,cstime,start_time; 以上分別爲進程在用戶態的運行時間、進程在內核態的運行時間、所有層次子進程在用戶態的運行時間總和、所有層次子進程在覈心態的運行時間總和,以及創建該進程的時間。 6. 信號量數據成員 (1) struct sem_undo *semundo; 進程每操作一次信號量,都生成一個對此次操作的undo操作,它由sem_undo結構描述。這些屬於同一進程的undo操作組成的鏈表就由 semundo屬性指示。當進程異常終止時,系統會調用undo操作。sem_undo的成員semadj指向一個數據數組,表示各次undo的量。結構 定義在include/linux/sem.h。 (2) struct sem_queue *semsleeping; 每一信號量集合對應一個sem_queue等待隊列(見include/linux/sem.h)。進程因操作該信號量集合而阻塞時,它被掛到 semsleeping指示的關於該信號量集合的sem_queue隊列。反過來,semsleeping。sleeper指向該進程的PCB。 7. 進程上下文環境 (1) struct desc_struct *ldt; 進程關於CPU段式存儲管理的局部描述符表的指針,用於仿真WINE Windows的程序。其他情況下取值NULL,進程的ldt就是arch/i386/traps.c定義的default_ldt。 (2) struct thread_struct tss; 任務狀態段,其內容與INTEL CPU的TSS對應,如各種通用寄存器.CPU調度時,當前運行進程的TSS保存到PCB的tss,新選中進程的tss內容複製到CPU的TSS。結構定義在include/linux/tasks.h中。 (3) unsigned long saved_kernel_stack; 爲MS-DOS的仿真程序(或叫系統調用vm86)保存的堆棧指針。 (4) unsigned long kernel_stack_page; 在內核態運行時,每個進程都有一個內核堆棧,其基地址就保存在kernel_stack_page中。 8. 文件系統數據成員 (1) struct fs_struct *fs; fs保存了進程本身與VFS的關係消息,其中root指向根目錄結點,pwd指向當前目錄結點,umask給出新建文件的訪問模式(可由系統調用 umask更改),count是Linux保留的屬性,如下頁圖所示。結構定義在include/linux/sched.h中。 (2) struct files_struct *files; files包含了進程當前所打開的文件(struct file *fd[NR_OPEN])。在Linux中,一個進程最多隻能同時打開NR_OPEN個文件。而且,前三項分別預先設置爲標準輸入、標準輸出和出錯消息輸出文件。 (3) int link_count; 文件鏈(link)的數目。 9. 內存數據成員 (1) struct mm_struct *mm; 在linux中,採用按需分頁的策略解決進程的內存需求。task_struct的數據成員mm指向關於存儲管理的mm_struct結構。其中包含了一 個虛存隊列mmap,指向由若干vm_area_struct描述的虛存塊。同時,爲了加快訪問速度,mm中的mmap_avl維護了一個AVL樹。在樹 中,所有的vm_area_struct虛存塊均由左指針指向相鄰的低虛存塊,右指針指向相鄰的高虛存塊。 結構定義在include/linux/sched.h中。 10. 頁面管理 (1) int swappable:1; 進程佔用的內存頁面是否可換出。swappable爲1表示可換出。對該標誌的復位和置位均在do_fork()函數中執行(見kerenl/fork.c)。 (2) unsigned long swap_address; 虛存地址比swap_address低的進程頁面,以前已經換出或已換出過,進程下一次可換出的頁面自swap_address開始。參見swap_out_process()和swap_out_pmd()(見mm/vmscan.c)。 (3) unsigned long min_flt,maj_flt; 該進程累計的minor缺頁次數和major缺頁次數。maj_flt基本與min_flt相同,但計數的範圍比後者廣(參見fs/buffer.c和 mm/page_alloc.c)。min_flt只在do_no_page()、do_wp_page()裏(見mm/memory.c)計數新增的可 以寫操作的頁面。 (4) unsigned long nswap; 該進程累計換出的頁面數。 (5) unsigned long cmin_flt,cmaj_flt,cnswap; 以本進程作爲祖先的所有層次子進程的累計換入頁面、換出頁面計數。 (6) unsigned long old_maj_flt,dec_flt; (7) unsigned long swap_cnt; 下一次信號最多可換出的頁數。 11. 支持對稱多處理器方式(SMP)時的數據成員 (1) int processor; 進程正在使用的CPU。 (2) int last_processor; 進程最後一次使用的CPU。 (3) int lock_depth; 上下文切換時系統內核鎖的深度。 12. 其它數據成員 (1) unsigned short used_math; 是否使用FPU。 (2) char comm[16]; 進程正在運行的可執行文件的文件名。 (3) struct rlimit rlim[RLIM_NLIMITS]; 結構rlimit用於資源管理,定義在linux/include/linux/resource.h中,成員共有兩項:rlim_cur是資源的當前最 大數目;rlim_max是資源可有的最大數目。在i386環境中,受控資源共有RLIM_NLIMITS項,即10項,定義在 linux/include/asm/resource.h中,見下表: (4) int errno; 最後一次出錯的系統調用的錯誤號,0表示無錯誤。系統調用返回時,全程量也擁有該錯誤號。 (5) long debugreg[8]; 保存INTEL CPU調試寄存器的值,在ptrace系統調用中使用。 (6) struct exec_domain *exec_domain; Linux可以運行由80386平臺其它UNIX操作系統生成的符合iBCS2標準的程序。關於此類程序與Linux程序差異的消息就由exec_domain結構保存。 (7) unsigned long personality; Linux可以運行由80386平臺其它UNIX操作系統生成的符合iBCS2標準的程序。 Personality進一步描述進程執行的程序屬於何種UNIX平臺的“個性”信息。通常有PER_Linux、PER_Linux_32BIT、 PER_Linux_EM86、PER_SVR3、PER_SCOSVR3、PER_WYSEV386、PER_ISCR4、PER_BSD、 PER_XENIX和PER_MASK等,參見include/linux/personality.h。 (8) struct linux_binfmt *binfmt; 指向進程所屬的全局執行文件格式結構,共有a。out、script、elf和java等四種。結構定義在include/linux/binfmts.h中(core_dump、load_shlib(fd)、load_binary、use_count)。 (9) int exit_code,exit_signal; 引起進程退出的返回代碼exit_code,引起錯誤的信號名exit_signal。 (10) int dumpable:1; 布爾量,表示出錯時是否可以進行memory dump。 (11) int did_exec:1; 按POSIX要求設計的布爾量,區分進程是正在執行老程序代碼,還是在執行execve裝入的新代碼。 (12) int tty_old_pgrp; 進程顯示終端所在的組標識。 (13) struct tty_struct *tty; 指向進程所在的顯示終端的信息。如果進程不需要顯示終端,如0號進程,則該指針爲空。結構定義在include/linux/tty.h中。 (14) struct wait_queue *wait_chldexit; 在進程結束時,或發出系統調用wait4後,爲了等待子進程的結束,而將自己(父進程)睡眠在該隊列上。結構定義在include/linux/wait.h中。 13. 進程隊列的全局變量 (1) current; 當前正在運行的進程的指針,在SMP中則指向CPU組中正被調度的CPU的當前進程: #define current(0+current_set[smp_processor_id()])/*sched.h*/ struct task_struct *current_set[NR_CPUS]; (2) struct task_struct init_task; 即0號進程的PCB,是進程的“根”,始終保持初值INIT_TASK。 (3) struct task_struct *task[NR_TASKS]; 進程隊列數組,規定系統可同時運行的最大進程數(見kernel/sched.c)。NR_TASKS定義在include/linux/tasks.h 中,值爲512。每個進程佔一個數組元素(元素的下標不一定就是進程的pid),task[0]必須指向init_task(0號進程)。可以通過 task[]數組遍歷所有進程的PCB。但Linux也提供一個宏定義for_each_task()(見 include/linux/sched.h),它通過next_task遍歷所有進程的PCB: #define for_each_task(p) / for(p=&init_task;(p=p->next_task)!=&init_task;) (4) unsigned long volatile jiffies; Linux的基準時間(見kernal/sched.c)。系統初始化時清0,以後每隔10ms由時鐘中斷服務程序do_timer()增1。 (5) int need_resched; 重新調度標誌位(見kernal/sched.c)。當需要Linux調度時置位。在系統調用返回前(或者其它情形下),判斷該標誌是否置位。置位的話,馬上調用schedule進行CPU調度。 (6) unsigned long intr_count; 記錄中斷服務程序的嵌套層數(見kernal/softirq.c)。正常運行時,intr_count爲0。當處理硬件中斷、執行任務隊列中的任務或者執行bottom half隊列中的任務時,intr_count非0。這時,內核禁止某些操作,例如不允許重新調度。 本文來自ChinaUnix博客,如果查看原文請點:http://blog.chinaunix.net/u/16490/showart_470150.html |