Linux下進程及其描述task_struct

在談進程之前，我們先說一說程序：在Linux下，我們想生成一個C程序，必定要通過預處理，編譯，彙編，鏈接這四步，才能得到一個可執行文件也就是我們的C程序，而對於我們操作系統而言，要運行一個磁盤上保存的二進制可執行文件，要進行哪些操作呢？

根據馮諾依曼體系結構，我們知道我們的CPU其實只跟我們的內存打交道，而在這裏我們要讓CPU運行我們的二進制可執行文件，就必然要將磁盤上的二進制文件加載到我們的內存當中，而當這份二進制文件被加載到內存當中後，就不僅僅是單純的二進制可執行文件這麼簡單，程序在這裏就會演變成爲我們所說的進程。

而對於進程，除了包含之前的二進制文件中的數據與代碼以外，還有一項非常重要的內容，也就是我們的進程控制塊PCB（在Linux下PCB就是task_struct的結構體），而在進程控制塊當中，則是包含所有描述該進程的信息，所以我們操作系統對於進程的管理主要通過兩個方面：

1.內核將磁盤上的二進制可執行文件讀入到內存當中，並且爲其分配對應的內存空間；

2.內核爲這個進程保存所有相關信息，構建PCB（task_struct結構體），並將其與其他進程的PCB以特定的數據結構管理組織管理起來；

這樣一來，我們操作系統的調度程序就可以根據對應的PCB找到對應的進程，就可以對其所管轄的進程進行調度執行了。

對於上述的兩個方面，首先我們來討論一下第一個，也就是內核將磁盤上的二進制文件讀入到內存當中，這裏就會形成對應的內存映像，而對於二進制可執行程序與進程的內存映像的不同之處在於：

1.二進制可執行程序在於硬盤之中，而進程的內存映像在於內存當中；

2.二進制可執行程序並不存在堆棧，只有當其被加載到內存當中後纔會被分配堆棧；

3.二進制可執行程序雖然也有未初始化的數據段，但它並不被存儲在硬盤中的可執行文件當中；

4.二進制可執行程序是靜態的，而我們的進程的內存映像是動態的，隨時變化的；

而進程的內存映像的大致佈局如下（也就是我們所說的地址空間）：

由此我們可以總結出：硬盤上的二進制可執行程序在被加載到內存當中，其中的數據以及代碼就保存在這個進程所對應的地址空間當中，而這個地址空間上的所有地址均爲虛擬地址，至於它與我們物理內存的關係，則是地址空間上的虛擬地址通過頁表以及CPU上的內存管理單元MMU這一硬件將虛擬地址通過映射，將其轉化成我們的物理地址。

我們操作系統內核在管理進程主要是通過對每個進程的PCB進行管理，而一個PCB中包含了這個進程的所有信息，而這些信息大致有哪些呢？（我們以Linux的task_struct爲例）

在進行剖析task_struct的定義之前，我們先按照我們的理論推一下它的結構：
1、進程狀態 ,將紀錄進程在等待,運行,或死鎖
2、調度信息, 由哪個調度函數調度,怎樣調度等
3、進程的通訊狀況
4、因爲要插入進程樹,必須有聯繫父子兄弟的指針, 當然是task_struct型
5、時間信息, 比如計算好執行的時間, 以便cpu 分配
6、標號 ,決定改進程歸屬
7、可以讀寫打開的一些文件信息
8、進程上下文和內核上下文
9、處理器上下文
10、內存信息

查看task_struct這個結構體定義的源碼可以通過/usr/src/kernels/2.6.32-431.el6.i686/include/linux這個路徑，去查找其中的sched.h文件，其中大致定義如下：

struct task_struct {
volatile long state;  //說明了該進程是否可以執行,還是可中斷等信息
unsigned long flags;  //Flage 是進程號,在調用fork()時給出
int sigpending;    //進程上是否有待處理的信號
mm_segment_t addr_limit; //進程地址空間,區分內核進程與普通進程在內存存放的位置不同
                        //0-0xBFFFFFFF for user-thead
                        //0-0xFFFFFFFF for kernel-thread
//調度標誌,表示該進程是否需要重新調度,若非0,則當從內核態返回到用戶態,會發生調度
volatile long need_resched;
int lock_depth;  //鎖深度
long nice;       //進程的基本時間片
//進程的調度策略,有三種,實時進程:SCHED_FIFO,SCHED_RR, 分時進程:SCHED_OTHER
unsigned long policy;
struct mm_struct *mm; //進程內存管理信息
int processor;
//若進程不在任何CPU上運行, cpus_runnable 的值是0，否則是1 這個值在運行隊列被鎖時更新
unsigned long cpus_runnable, cpus_allowed;
struct list_head run_list; //指向運行隊列的指針
unsigned long sleep_time;  //進程的睡眠時間
//用於將系統中所有的進程連成一個雙向循環鏈表, 其根是init_task
struct task_struct *next_task, *prev_task;
struct mm_struct *active_mm;
struct list_head local_pages;       //指向本地頁面      
unsigned int allocation_order, nr_local_pages;
struct linux_binfmt *binfmt;  //進程所運行的可執行文件的格式
int exit_code, exit_signal;
int pdeath_signal;     //父進程終止是向子進程發送的信號
unsigned long personality;
//Linux可以運行由其他UNIX操作系統生成的符合iBCS2標準的程序
int did_exec:1; 
pid_t pid;    //進程標識符,用來代表一個進程
pid_t pgrp;   //進程組標識,表示進程所屬的進程組
pid_t tty_old_pgrp;  //進程控制終端所在的組標識
pid_t session;  //進程的會話標識
pid_t tgid;
int leader;     //表示進程是否爲會話主管
struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;
struct list_head thread_group;   //線程鏈表
struct task_struct *pidhash_next; //用於將進程鏈入HASH表
struct task_struct **pidhash_pprev;
wait_queue_head_t wait_chldexit;  //供wait4()使用
struct completion *vfork_done;  //供vfork() 使用
unsigned long rt_priority; //實時優先級，用它計算實時進程調度時的weight值
 
//it_real_value，it_real_incr用於REAL定時器，單位爲jiffies, 系統根據it_real_value
//設置定時器的第一個終止時間. 在定時器到期時，向進程發送SIGALRM信號，同時根據
//it_real_incr重置終止時間，it_prof_value，it_prof_incr用於Profile定時器，單位爲jiffies。
//當進程運行時，不管在何種狀態下，每個tick都使it_prof_value值減一，當減到0時，向進程發送
//信號SIGPROF，並根據it_prof_incr重置時間.
//it_virt_value，it_virt_value用於Virtual定時器，單位爲jiffies。當進程運行時，不管在何種
//狀態下，每個tick都使it_virt_value值減一當減到0時，向進程發送信號SIGVTALRM，根據
//it_virt_incr重置初值。
unsigned long it_real_value, it_prof_value, it_virt_value;
unsigned long it_real_incr, it_prof_incr, it_virt_value;
struct timer_list real_timer;   //指向實時定時器的指針
struct tms times;      //記錄進程消耗的時間
unsigned long start_time;  //進程創建的時間
//記錄進程在每個CPU上所消耗的用戶態時間和核心態時間
long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS]; 
//內存缺頁和交換信息:
//min_flt, maj_flt累計進程的次缺頁數（Copy on　Write頁和匿名頁）和主缺頁數（從映射文件或交換
//設備讀入的頁面數）； nswap記錄進程累計換出的頁面數，即寫到交換設備上的頁面數。
//cmin_flt, cmaj_flt, cnswap記錄本進程爲祖先的所有子孫進程的累計次缺頁數，主缺頁數和換出頁面數。
//在父進程回收終止的子進程時，父進程會將子進程的這些信息累計到自己結構的這些域中
unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
int swappable:1; //表示進程的虛擬地址空間是否允許換出
//進程認證信息
//uid,gid爲運行該進程的用戶的用戶標識符和組標識符，通常是進程創建者的uid，gid
//euid，egid爲有效uid,gid
//fsuid，fsgid爲文件系統uid,gid，這兩個ID號通常與有效uid,gid相等，在檢查對於文件
//系統的訪問權限時使用他們。
//suid，sgid爲備份uid,gid
uid_t uid,euid,suid,fsuid;
gid_t gid,egid,sgid,fsgid;
int ngroups; //記錄進程在多少個用戶組中
gid_t groups[NGROUPS]; //記錄進程所在的組
//進程的權能，分別是有效位集合，繼承位集合，允許位集合
kernel_cap_t cap_effective, cap_inheritable, cap_permitted;
int keep_capabilities:1;
struct user_struct *user;
struct rlimit rlim[RLIM_NLIMITS];  //與進程相關的資源限制信息
unsigned short used_math;   //是否使用FPU
char comm[16];   //進程正在運行的可執行文件名
 //文件系統信息
int link_count, total_link_count;
//NULL if no tty 進程所在的控制終端，如果不需要控制終端，則該指針爲空
struct tty_struct *tty;
unsigned int locks;
//進程間通信信息
struct sem_undo *semundo;  //進程在信號燈上的所有undo操作
struct sem_queue *semsleeping; //當進程因爲信號燈操作而掛起時，他在該隊列中記錄等待的操作
//進程的CPU狀態，切換時，要保存到停止進程的task_struct中
struct thread_struct thread;
  //文件系統信息
struct fs_struct *fs;
  //打開文件信息
struct files_struct *files;
  //信號處理函數
spinlock_t sigmask_lock;
struct signal_struct *sig; //信號處理函數
sigset_t blocked;  //進程當前要阻塞的信號，每個信號對應一位
struct sigpending pending;  //進程上是否有待處理的信號
unsigned long sas_ss_sp;
size_t sas_ss_size;
int (*notifier)(void *priv);
void *notifier_data;
sigset_t *notifier_mask;
u32 parent_exec_id;
u32 self_exec_id;

spinlock_t alloc_lock;
void *journal_info;
};

以上內容我是參考了http://blog.sina.com.cn/s/blog_65403f9b0100gs3a.html這篇博客。

而其中幾個重要的成員如下：

標示符 pid：描述本進程的唯一標示符，用來區別其他進程。（通過系統調用getpid()與getppid()可以分別獲取當前進程pid與其父進程pid，這裏要注意一點：所有通過命令行進行的進程，其父進程均爲shell）
狀態：任務狀態，退出代碼，退出信號等。
優先級：相對於其他進程的優先級。
程序計數器：程序中即將被執行的下一條指令的地址。
內存指針：包括程序代碼和進程相關數據的指針，還有和其他進程共享的內存塊的指針
上下文數據：進程執行時處理器的寄存器中的數據。
I／O狀態信息：包括顯示的I/O請求,分配給進程的I／O設備和被進程使用的文件列表。
記賬信息：可能包括處理器時間總和，使用的時鐘數總和，時間限制，記賬號等。

還有這裏不得不提的一項就是mmstruct這個結構體，在上面的源碼中也有相關定義：

struct mm_struct *mm; //進程內存管理信息

其實，mmstruct這個結構體主要描述了Linux視角下管理進程地址空間的信息，它主要通過以對應的start和end兩個數據來對地址空間中的每一個區域進行對應的劃分其範圍。

最後附上一張圖：

Linux下進程及其描述task_struct

關於系統調用fork（）

關於Linux操作系統層次結構分析

二叉搜索樹的實現（查找，插入，刪除的遞歸與非遞歸）

二叉樹的幾道典型例題

Linux下粘滯位

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結