Linux下進程及其描述task_struct

在談進程之前,我們先說一說程序:在Linux下,我們想生成一個C程序,必定要通過預處理,編譯,彙編,鏈接這四步,才能得到一個可執行文件也就是我們的C程序,而對於我們操作系統而言,要運行一個磁盤上保存的二進制可執行文件,要進行哪些操作呢?

根據馮諾依曼體系結構,我們知道我們的CPU其實只跟我們的內存打交道,而在這裏我們要讓CPU運行我們的二進制可執行文件,就必然要將磁盤上的二進制文件加載到我們的內存當中,而當這份二進制文件被加載到內存當中後,就不僅僅是單純的二進制可執行文件這麼簡單,程序在這裏就會演變成爲我們所說的進程。

而對於進程,除了包含之前的二進制文件中的數據與代碼以外,還有一項非常重要的內容,也就是我們的進程控制塊PCB(在Linux下PCB就是task_struct的結構體),而在進程控制塊當中,則是包含所有描述該進程的信息,所以我們操作系統對於進程的管理主要通過兩個方面:

1.內核將磁盤上的二進制可執行文件讀入到內存當中,並且爲其分配對應的內存空間;

2.內核爲這個進程保存所有相關信息,構建PCB(task_struct結構體),並將其與其他進程的PCB以特定的數據結構管理組織管理起來;

這樣一來,我們操作系統的調度程序就可以根據對應的PCB找到對應的進程,就可以對其所管轄的進程進行調度執行了。

對於上述的兩個方面,首先我們來討論一下第一個,也就是內核將磁盤上的二進制文件讀入到內存當中,這裏就會形成對應的內存映像,而對於二進制可執行程序與進程的內存映像的不同之處在於:

1.二進制可執行程序在於硬盤之中,而進程的內存映像在於內存當中;

2.二進制可執行程序並不存在堆棧,只有當其被加載到內存當中後纔會被分配堆棧;

3.二進制可執行程序雖然也有未初始化的數據段,但它並不被存儲在硬盤中的可執行文件當中;

4.二進制可執行程序是靜態的,而我們的進程的內存映像是動態的,隨時變化的;

而進程的內存映像的大致佈局如下(也就是我們所說的地址空間):


由此我們可以總結出:硬盤上的二進制可執行程序在被加載到內存當中,其中的數據以及代碼就保存在這個進程所對應的地址空間當中,而這個地址空間上的所有地址均爲虛擬地址,至於它與我們物理內存的關係,則是地址空間上的虛擬地址通過頁表以及CPU上的內存管理單元MMU這一硬件將虛擬地址通過映射,將其轉化成我們的物理地址。

我們操作系統內核在管理進程主要是通過對每個進程的PCB進行管理,而一個PCB中包含了這個進程的所有信息,而這些信息大致有哪些呢?(我們以Linux的task_struct爲例)

在進行剖析task_struct的定義之前,我們先按照我們的理論推一下它的結構:
1、進程狀態 ,將紀錄進程在等待,運行,或死鎖
2、調度信息, 由哪個調度函數調度,怎樣調度等
3、進程的通訊狀況
4、因爲要插入進程樹,必須有聯繫父子兄弟的指針, 當然是task_struct型
5、時間信息, 比如計算好執行的時間, 以便cpu 分配
6、標號 ,決定改進程歸屬
7、可以讀寫打開的一些文件信息
8、 進程上下文和內核上下文
9、處理器上下文
10、內存信息

查看task_struct這個結構體定義的源碼可以通過/usr/src/kernels/2.6.32-431.el6.i686/include/linux這個路徑,去查找其中的sched.h文件,其中大致定義如下:

struct task_struct {
volatile long state;  //說明了該進程是否可以執行,還是可中斷等信息
unsigned long flags;  //Flage 是進程號,在調用fork()時給出
int sigpending;    //進程上是否有待處理的信號
mm_segment_t addr_limit; //進程地址空間,區分內核進程與普通進程在內存存放的位置不同
                        //0-0xBFFFFFFF for user-thead
                        //0-0xFFFFFFFF for kernel-thread
//調度標誌,表示該進程是否需要重新調度,若非0,則當從內核態返回到用戶態,會發生調度
volatile long need_resched;
int lock_depth;  //鎖深度
long nice;       //進程的基本時間片
//進程的調度策略,有三種,實時進程:SCHED_FIFO,SCHED_RR, 分時進程:SCHED_OTHER
unsigned long policy;
struct mm_struct *mm; //進程內存管理信息
int processor;
//若進程不在任何CPU上運行, cpus_runnable 的值是0,否則是1 這個值在運行隊列被鎖時更新
unsigned long cpus_runnable, cpus_allowed;
struct list_head run_list; //指向運行隊列的指針
unsigned long sleep_time;  //進程的睡眠時間
//用於將系統中所有的進程連成一個雙向循環鏈表, 其根是init_task
struct task_struct *next_task, *prev_task;
struct mm_struct *active_mm;
struct list_head local_pages;       //指向本地頁面      
unsigned int allocation_order, nr_local_pages;
struct linux_binfmt *binfmt;  //進程所運行的可執行文件的格式
int exit_code, exit_signal;
int pdeath_signal;     //父進程終止是向子進程發送的信號
unsigned long personality;
//Linux可以運行由其他UNIX操作系統生成的符合iBCS2標準的程序
int did_exec:1; 
pid_t pid;    //進程標識符,用來代表一個進程
pid_t pgrp;   //進程組標識,表示進程所屬的進程組
pid_t tty_old_pgrp;  //進程控制終端所在的組標識
pid_t session;  //進程的會話標識
pid_t tgid;
int leader;     //表示進程是否爲會話主管
struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;
struct list_head thread_group;   //線程鏈表
struct task_struct *pidhash_next; //用於將進程鏈入HASH表
struct task_struct **pidhash_pprev;
wait_queue_head_t wait_chldexit;  //供wait4()使用
struct completion *vfork_done;  //供vfork() 使用
unsigned long rt_priority; //實時優先級,用它計算實時進程調度時的weight值
 
//it_real_value,it_real_incr用於REAL定時器,單位爲jiffies, 系統根據it_real_value
//設置定時器的第一個終止時間. 在定時器到期時,向進程發送SIGALRM信號,同時根據
//it_real_incr重置終止時間,it_prof_value,it_prof_incr用於Profile定時器,單位爲jiffies。
//當進程運行時,不管在何種狀態下,每個tick都使it_prof_value值減一,當減到0時,向進程發送
//信號SIGPROF,並根據it_prof_incr重置時間.
//it_virt_value,it_virt_value用於Virtual定時器,單位爲jiffies。當進程運行時,不管在何種
//狀態下,每個tick都使it_virt_value值減一當減到0時,向進程發送信號SIGVTALRM,根據
//it_virt_incr重置初值。
unsigned long it_real_value, it_prof_value, it_virt_value;
unsigned long it_real_incr, it_prof_incr, it_virt_value;
struct timer_list real_timer;   //指向實時定時器的指針
struct tms times;      //記錄進程消耗的時間
unsigned long start_time;  //進程創建的時間
//記錄進程在每個CPU上所消耗的用戶態時間和核心態時間
long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS]; 
//內存缺頁和交換信息:
//min_flt, maj_flt累計進程的次缺頁數(Copy on Write頁和匿名頁)和主缺頁數(從映射文件或交換
//設備讀入的頁面數); nswap記錄進程累計換出的頁面數,即寫到交換設備上的頁面數。
//cmin_flt, cmaj_flt, cnswap記錄本進程爲祖先的所有子孫進程的累計次缺頁數,主缺頁數和換出頁面數。
//在父進程回收終止的子進程時,父進程會將子進程的這些信息累計到自己結構的這些域中
unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
int swappable:1; //表示進程的虛擬地址空間是否允許換出
//進程認證信息
//uid,gid爲運行該進程的用戶的用戶標識符和組標識符,通常是進程創建者的uid,gid
//euid,egid爲有效uid,gid
//fsuid,fsgid爲文件系統uid,gid,這兩個ID號通常與有效uid,gid相等,在檢查對於文件
//系統的訪問權限時使用他們。
//suid,sgid爲備份uid,gid
uid_t uid,euid,suid,fsuid;
gid_t gid,egid,sgid,fsgid;
int ngroups; //記錄進程在多少個用戶組中
gid_t groups[NGROUPS]; //記錄進程所在的組
//進程的權能,分別是有效位集合,繼承位集合,允許位集合
kernel_cap_t cap_effective, cap_inheritable, cap_permitted;
int keep_capabilities:1;
struct user_struct *user;
struct rlimit rlim[RLIM_NLIMITS];  //與進程相關的資源限制信息
unsigned short used_math;   //是否使用FPU
char comm[16];   //進程正在運行的可執行文件名
 //文件系統信息
int link_count, total_link_count;
//NULL if no tty 進程所在的控制終端,如果不需要控制終端,則該指針爲空
struct tty_struct *tty;
unsigned int locks;
//進程間通信信息
struct sem_undo *semundo;  //進程在信號燈上的所有undo操作
struct sem_queue *semsleeping; //當進程因爲信號燈操作而掛起時,他在該隊列中記錄等待的操作
//進程的CPU狀態,切換時,要保存到停止進程的task_struct中
struct thread_struct thread;
  //文件系統信息
struct fs_struct *fs;
  //打開文件信息
struct files_struct *files;
  //信號處理函數
spinlock_t sigmask_lock;
struct signal_struct *sig; //信號處理函數
sigset_t blocked;  //進程當前要阻塞的信號,每個信號對應一位
struct sigpending pending;  //進程上是否有待處理的信號
unsigned long sas_ss_sp;
size_t sas_ss_size;
int (*notifier)(void *priv);
void *notifier_data;
sigset_t *notifier_mask;
u32 parent_exec_id;
u32 self_exec_id;

spinlock_t alloc_lock;
void *journal_info;
};

以上內容我是參考了http://blog.sina.com.cn/s/blog_65403f9b0100gs3a.html這篇博客。

而其中幾個重要的成員如下:

標示符 pid: 描述本進程的唯一標示符,用來區別其他進程。(通過系統調用getpid()與getppid()可以分別獲取當前進程pid與其父進程pid,這裏要注意一點:所有通過命令行進行的進程,其父進程均爲shell)
狀態 :任務狀態,退出代碼,退出信號等。
優先級 :相對於其他進程的優先級。
程序計數器:程序中即將被執行的下一條指令的地址。
內存指針:包括程序代碼和進程相關數據的指針,還有和其他進程共享的內存塊的指針
上下文數據:進程執行時處理器的寄存器中的數據。
I/O狀態信息:包括顯示的I/O請求,分配給進程的I/O設備和被進程使用的文件列表。
記賬信息:可能包括處理器時間總和,使用的時鐘數總和,時間限制,記賬號等。

還有這裏不得不提的一項就是mmstruct這個結構體,在上面的源碼中也有相關定義:

struct mm_struct *mm; //進程內存管理信息
其實,mmstruct這個結構體主要描述了Linux視角下管理進程地址空間的信息,它主要通過以對應的start和end兩個數據來對地址空間中的每一個區域進行對應的劃分其範圍。


最後附上一張圖:




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章