一個fork的面試題

文/陳皓

  前兩天有人問了個關於 Unix 的 fork ()系統調用的面試題,這個題正好是我大約十年前找工作時某公司問我的一個題,我覺得比較有趣,寫篇文章與大家分享一下。這個題是這樣的:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
 
int main (void)
{
   int i;
   for(i=0; i<2; i++){
      fork ();
      printf ("-");
   }
 
   return 0;
}

如果你對 fork ()的機制比較熟悉的話,這個題並不難,輸出應該是 6 個“-”,但是,實際上這個程序會很 tricky 地輸出 8 個“-”。

  要講清這個題,我們首先需要知道 fork ()系統調用的特性,

  • fork ()系統調用是 Unix 下以自身進程創建子進程的系統調用,一次調用,兩次返回,如果返回是0,則是子進程,如果返回值>0,則是父進程(返回值是子進程的 pid),這是衆爲周知的。
  • 還有一個很重要的東西是,在 fork ()的調用處,整個父進程空間會原模原樣地複製到子進程中,包括指令,變量值,程序調用棧,環境變量,緩衝區,等等。

  所以,上面的那個程序爲什麼會輸入 8 個“-”,這是因爲 printf (“-”); 語句有 buffer,所以,對於上述程序,printf (“-”);把“-”放到了緩存中,並沒有真正的輸出(參看《C語言的迷題》中的第一題),在 fork 的時候,緩存被複制到了子進程空間,所以,就多了兩個,就成了 8 個,而不是 6 個。

  另外,多說一下,我們知道,Unix 下的設備有“塊設備”和“字符設備”的概念,所謂塊設備,就是以一塊一塊的數據存取的設備,字符設備是一次存取一個字符的設備。磁盤、內存都是塊設備,字符設備如鍵盤和串口。塊設備一般都有緩存,而字符設備一般都沒有緩存

  對於上面的問題,我們如果修改一下上面的 printf 的那條語句爲:

printf ("-\n");
或是

就沒有問題了(就是 6 個“-”了),因爲程序遇到“\n”,或是 EOF,或是緩中區滿,或是文件描述符關閉,或是主動 flush,或是程序退出,就會把數據刷出緩衝區。需要注意的是,標準輸出是行緩衝,所以遇到“\n”的時候會刷出緩衝區,但對於磁盤這個塊設備來說,“\n”並不會引起緩衝區刷出的動作,那是全緩衝,你可以使用 setvbuf 來設置緩衝區大小,或是用 fflush 刷緩存。

  我估計有些朋友可能對於 fork ()還不是很瞭解,那麼我們把上面的程序改成下面這樣:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main (void)
{
   int i;
   for(i=0; i<2; i++){
      fork ();
      //注意:下面的 printf 有“\n”
      printf ("ppid=%d, pid=%d, i=%d \n", getppid (), getpid (), i);
   }
   sleep (10); //讓進程停留十秒,這樣我們可以用 pstree 查看一下進程樹
   return 0;
}
 於是,上面這段程序會輸出下面的結果,(注:編譯出的可執行的程序名爲 fork)

 面對這樣的圖你可能還是看不懂,沒事,我好事做到底,畫個圖給你看看:

注意:上圖中的我用了幾個色彩,相同顏色的是同一個進程。於是,我們的 pstree 的圖示就可以成爲下面這個樣子:(下圖中的顏色與上圖對應)

 這樣,對於 printf (“-”);這個語句,我們就可以很清楚的知道,哪個子進程複製了父進程標準輸出緩中區裏的的內容,而導致了多次輸出了。(如下圖所示,就是我陰影並雙邊框了那兩個子進程)


題目就是在parent第二次fork出灰child時,和黃child第一次fork出粉child的時候,把緩存複製了。


發佈了46 篇原創文章 · 獲贊 3 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章