fork()函數詳解

一、fork入門知識

     一個進程，包括代碼、數據和分配給進程的資源。fork（）函數通過系統調用創建一個與原來進程幾乎完全相同的進程，也就是兩個進程可以做完全相同的事，但如果初始參數或者傳入的變量不同，兩個進程也可以做不同的事。
    一個進程調用fork（）函數後，系統先給新的進程分配資源，例如存儲數據和代碼的空間。然後把原來的進程的所有值都複製到新的新進程中，只有少數值與原來的進程的值不同。相當於克隆了一個自己。

     我們來看一個例子：

點擊(此處)摺疊或打開

#include <stdio.h>

#include <unistd.h>

#include <sys/types.h>

#include <stdlib.h>

/*

* @brief main For the understanding of the fork()

*

* @param argc

* @param argv[]

*

* @return 在父進程中返回子進程的進程號;在子進程中返回0。

*/

int main(int argc, char *argv[])

{

    pid_t pid; 

    int cnt = 0;

    pid = fork();

    if (pid == -1) {

        perror("fork error");

        exit(1);

    } else if (pid == 0) {

        printf("The returned value is %d\nIn child process!!\nMy PID is %d\n",

        pid, getpid());

        cnt++;

    } else {

        printf("The returned value is %d\nIn father process!!\nMy PID is %d\n",

        pid, getpid());

        cnt++;

    }

    printf("cnt = %d\n", cnt);

    return 0;

}

     運行結果是：
     The returned value is 20473
     In father process!!
     My PID is 20472
     cnt = 1
     The returned value is 0
     In child process!!
     My PID is 20473
     cnt = 1

    在語句pid=fork()之前，只有一個進程在執行這段代碼，但在這條語句之後，就變成兩個進程在執行了，這兩個進程的幾乎完全相同，將要執行的下一條語句都是if(pid == -1)……
    爲什麼兩個進程的pid不同呢，這與fork函數的特性有關。fork調用的一個奇妙之處就是它僅僅被調用一次，卻能夠返回兩次，它可能有三種不同的返回值：
    1）在父進程中，fork返回新創建子進程的進程ID；
    2）在子進程中，fork返回0；
    3）如果出現錯誤，fork返回-1；

    在fork函數執行完畢後，如果創建新進程成功，則出現兩個進程，一個是子進程，一個是父進程。在子進程中，fork函數返回0，在父進程中，fork返回新創建子進程的進程ID。我們可以通過fork返回的值來判斷當前進程是子進程還是父進程。

    pid的值爲什麼在父子進程中不同。“其實就相當於鏈表，進程形成了鏈表，父進程的pid(p 意味point)指向子進程的進程id, 因爲子進程沒有子進程，所以其pid爲0.

    fork出錯可能有兩種原因：
    1）當前的進程數已經達到了系統規定的上限，這時errno的值被設置爲EAGAIN。
    2）系統內存不足，這時errno的值被設置爲ENOMEM。
    創建新進程成功後，系統中出現兩個基本完全相同的進程，子進程從父進程處繼承了整個進程的地址空間，包括進程上下文、代碼段、進程堆棧、內存信息、打開的文件描述符、信號控制設定、進程優先級、進程組號、當前工作目錄、根目錄、資源限制和控制終端, 父子進程不共享這些存儲空間部分，父子進程共享正文段。這兩個進程執行沒有固定的先後順序，哪個進程先執行要看系統的進程調度策略。

    每個進程都有一個獨特（互不相同）的進程標識符（process ID），可以通過getpid（）函數獲得，還有一個記錄父進程pid的變量，可以通過getppid（）函數獲得變量的值。

有人說兩個進程的內容完全一樣啊，怎麼打印的結果不一樣啊，那是因爲判斷條件的原因，上面列舉的只是進程的代碼和指令，還有變量啊。

    執行完fork後，進程1的變量爲cnt=0，pid != 0（父進程）。進程2的變量爲count=0，pid=0（子進程），這兩個進程的變量都是獨立的，存在不同的地址中，不是共用的，這點要注意。可以說，我們就是通過pid來識別和操作父子進程的。
    還有人可能疑惑爲什麼不是從#include處開始複製代碼的，這是因爲fork是把進程當前的情況拷貝一份，執行fork時，進程已經執行完了int cnt=0;fork只拷貝下一個要執行的代碼到新的進程。

二、fork進階知識

    先看一份代碼：

點擊(此處)摺疊或打開

#include <unistd.h>

#include <stdio.h>

int main(int argc, char *argv[])

{

    int i = 0;

    printf("i\tson/pa\tppid\tpid\treturn\n");

    /*

     *ppid指當前進程的父進程pid 

     *pid指當前進程的pid, 

     *return指fork返回給當前進程的值 

     */

    for (i = 0; i < 2; i++) {

        pid_t pid = fork();

        if (pid == 0)

            printf("%d\tchild\t%d\t%d\t%4d\n", i, getppid(),

                   getpid(), pid);

        else

            printf("%d\tparent\t%d\t%d\t%d\n", i, getppid(),

                   getpid(), pid);

    }

    return 0;

}

    運行結果是：
    i    son/pa    ppid    pid     return
    0    parent    2043 3224    3225
    0    child     3224     3225       0
    1    parent    2043    3224    3226
    1    parent    3224    3225    3227
    1    child          1       3227       0
    1    child          1       3226       0
    這份代碼比較有意思，我們來認真分析一下：
    第一步：在父進程中，指令執行到for循環中，i=0，接着執行fork，fork執行完後，系統中出現兩個進程，分別是p3224和p3225（後面我都用pxxxx表示進程id爲xxxx的進程）。可以看到父進程p3224的父進程是p2043，子進程p3225的父進程正好是p3224。我們用一個鏈表來表示這個關係：
    p2043->p3224->p3225
    第一次fork後，p3224（父進程）的變量爲i=0，pid=3225（fork函數在父進程中返向子進程id），代碼內容爲：
    for(i=0;i<2;i++){
        pid_t pid=fork();//執行完畢，i=0，return=3225
        if(pid==0)
           printf("%d child %4d %4d %4d/n",i,getppid(),getpid(),pid);
        else
           printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),pid);
    }
    return 0;

    p3225（子進程）的變量爲i=0，pid=0（fork函數在子進程中返回0），代碼內容爲：

    for(i=0;i<2;i++){
        pid_t pid=fork();//執行完畢，i=0，return=0
        if(pid==0)
           printf("%d child %4d %4d %4d/n",i,getppid(),getpid(),pid);
        else
           printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),pid);
    }
    return 0;

    所以打印出結果：
    0 parent 2043 3224 3225
    0 child 3224 3225    0
    第二步：假設父進程p3224先執行，當進入下一個循環時，i=1，接着執行fork，系統中又新增一個進程p3226，對於此時的父進程，p2043->p3224（當前進程）->p3226（被創建的子進程）。
    對於子進程p3225，執行完第一次循環後，i=1，接着執行fork，系統中新增一個進程p3227，對於此進程，p3224->p3225（當前進程）->p3227（被創建的子進程）。從輸出可以看到p3225原來是p3224的子進程，現在變成p3227的父進程。父子是相對的，這個大家應該容易理解。只要當前進程執行了fork，該進程就變成了父進程了，就打印出了parent。
    所以打印出結果是：
    1 parent 2043 3224 3226
    1 parent 3224 3225 3227
    第三步：第二步創建了兩個進程p3226，p3227，這兩個進程執行完printf函數後就結束了，因爲這兩個進程無法進入第三次循環，無法fork，該執行return 0;了，其他進程也是如此。
    以下是p3226，p3227打印出的結果：
    1 child     1 3227    0
    1 child     1 3226    0
    細心的讀者可能注意到p3226，p3227的父進程難道不該是p3224和p3225嗎，怎麼會是1呢？這裏得講到進程的創建和死亡的過程，在p3224和p3225執行完第二個循環後，main函數就該退出了，也即進程該死亡了，因爲它已經做完所有事情了。p3224和p3225死亡後，p3226，p3227就沒有父進程了，這在操作系統是不被允許的，所以p3226，p3227的父進程就被置爲p1了，p1是永遠不會死亡的，因爲現在的父進程退出了，現在的子進程成爲了孤兒進程，系統將它託孤到1號進程init進程，init進程是系統啓動後的第一個執行的進程，因爲進程的創建是由fork來實現的，所以init進程是所有進程的祖先進程。
    總結一下，這個程序執行的流程如下：

它的執行結果是：
    father
    son
    father
    father
    father
    father
    son
    son
    father
    son
    son
    son
    father
    son
    這裏就不做詳細解釋了，只做一個大概的分析。
    for        i=0         1           2
              father     father     father
                                        son
                            son       father
                                        son
               son       father     father
                                        son
                            son       father
                                        son
    其中每一行分別代表一個進程的運行打印結果。
    總結一下規律，對於這種N次循環的情況，執行printf函數的次數爲2*（1+2+4+……+2N-1）次，創建的子進程數爲1+2+4+……+2N-1個。
    數學推理見-->http://blog.chinaunix.net/uid-26495963-id-3150121.html。
    同時，大家如果想測一下一個程序中到底創建了幾個子進程，最好的方法就是調用printf函數打印該進程的pid，也即調用printf("%d\n",getpid());或者通過printf("+\n");來判斷產生了幾個進程。有人想通過調用printf("+");來統計創建了幾個進程，這是不妥當的。具體原因我來分析。
    老規矩，大家看一下下面的代碼：

點擊(此處)摺疊或打開

#include <unistd.h> 

    #include <stdio.h> 

    int main() { 

        pid_t pid;//pid表示fork函數返回的值 

        //printf("fork!"); 

        printf("fork!/n"); 

        pid = fork(); 

        if (pid < 0) 

            printf("error in fork!"); 

        else if (pid == 0) 

            printf("I am the child process, my process id is %d/n", getpid()); 

        else 

            printf("I am the parent process, my process id is %d/n", getpid()); 

        return 0; 

    }

    執行結果如下：
    fork!
    I am the parent process, my process id is 3361
    I am the child process, my process id is 3362
    如果把語句printf("fork!\n");註釋掉，執行printf("fork!");
    則新的程序的執行結果是：
    fork!I am the parent process, my process id is 3298
    fork!I am the child process, my process id is 3299
    程序的唯一的區別就在於一個\n回車符號，爲什麼結果會相差這麼大呢？
    這就跟printf的緩衝機制有關了，printf某些內容時，操作系統僅僅是把該內容放到了stdout的緩衝隊列裏了,並沒有實際的寫到屏幕上。但是,只要看到有\n 則會立即刷新stdout,因此就馬上能夠打印了。
    運行了printf("fork!")後,“fork!”僅僅被放到了緩衝裏,程序運行到fork時緩衝裏面的“fork!” 被子進程複製過去了。因此在子進程度stdout緩衝裏面就也有了fork! 。所以,你最終看到的會是fork!  被printf了2次！！！！
    而運行printf("fork!\n")後,“fork!”被立即打印到了屏幕上,之後fork到的子進程裏的stdout緩衝裏不會有fork! 內容。因此你看到的結果會是fork! 被printf了1次！！！！
    所以說printf("+");不能正確地反應進程的數量。
    大家看了這麼多可能有點疲倦吧，不過我還得貼最後一份代碼來進一步分析fork函數。

點擊(此處)摺疊或打開

#include <stdio.h> 

#include <unistd.h> 

int main(int argc, char* argv[]) 

{ 

    fork(); 

    fork() && fork() || fork(); 

    fork(); 

    return 0; 

}

    問題是不算main這個進程自身，程序到底創建了多少個進程。
    爲了解答這個問題，我們先做弊一下，先用程序驗證一下，到此有多少個進程。
    #include
    int main(int argc, char* argv[])
    {
       fork();
       fork() && fork() || fork();
       fork();
       printf("+/n");
    }

    答案是總共20個進程，除去main進程，還有19個進程。
    我們再來仔細分析一下，爲什麼是還有19個進程。
    第一個fork和最後一個fork肯定是會執行的。
    主要在中間3個fork上，可以畫一個圖進行描述。
    這裏就需要注意&&和||運算符。
    A&&B，如果A=0，就沒有必要繼續執行&&B了；A非0，就需要繼續執行&&B。
    A||B，如果A非0，就沒有必要繼續執行||B了，A=0，就需要繼續執行||B。
    fork()對於父進程和子進程的返回值是不同的，按照上面的A&&B和A||B的分支進行畫圖，可以得出5個分支。

加上前面的fork和最後的fork，總共4*5=20個進程，除去main主進程，就是19個進程了。

fork()函數詳解

latex中bib引用順序不正確，引用順序和正文不一致怎麼辦？

概率算法/重合指數法破解凱撒偏移密碼

[RevitSDK解讀]UIAPI->PreviewModel：在自己的界面顯示Revit視圖

B+樹重複值問題

fork()函數詳解

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結