操作系統--進程與線程

進程的概念

  進程是一個具有獨立功能的程序在某個數據集合上的一次運行過程,是系統進行資源分配和調度的一個獨立單位。
(注:一個程序在不同數據集上運行或者一個程序在同一數據集上的多次運行都是不同進程)
(注:進程由多個程序併發執行,各個程序輪流使用CPU。併發,在操作系統中,是指一個時間段中有幾個程序都處於已啓動運行到運行完畢之間,且這幾個程序都是在同一個處理機上運行,但任一個時刻點上只有一個程序在處理機上運行)
       通俗地講,進程是一個“執行中的程序”。程序是一個沒有生命的實體,只有處理器賦予程序生命時,它才能成爲一個活動的實體,我們稱其爲進程。它可以申請和擁有系統資源,是一個動態的概念,是一個活動的實體,還包括當前的活動,通過程序計數器的值和處理寄存器的內容來表示。而程序是一組有序的靜態指令,屬於一種靜態概念。
     爲了控制進程的運行,當某程序不在CPU上運行時,必須保存其被中斷的程序的現場,包括斷點地址、通用寄存器內容、堆棧內容、程序大小等,以便程序再次獲得CPU時能正確運行。爲了保存這些內容,需要建立一個專門的數據結構,這個數據結構稱爲進程控制塊PCB(Process Control Block)
    一個進程可以創建一個新進程,前者稱爲父進程,後者稱爲子進程,子進程又可以創建新的子進程。
   創建一個進程的過程:建立PCB,具體操作是先申請一塊空閒PCB區域,將有關信息填入PCB,將該進程標記爲就緒狀態,最後把他插入就緒隊列。

線程的概念

     線程是進程的一個實體,是CPU調度和分派的基本單位,它是比進程更小的能獨立運行的基本單位.線程自己基本上不擁有系統資源,只擁有一點在運行中必不可少的資源(如程序計數器,一組寄存器和棧),但是它可與同屬一個進程的其他的線程共享進程所擁有的全部資源,線程是操作系統可識別的最小執行和調度單位。線程有時又被稱爲輕權進程或輕量級進程,也是 CPU 調度的一個基本單位。

進程和線程的聯繫

    一個線程只能屬於一個進程,而一個進程可以有多個線程,但至少有一個線程(單線程)。
    一個線程可以創建和撤銷另一個線程;同一個進程中的多個線程之間可以併發執行.相對進程而言,線程是一個更加接近於執行體的概念,它可以與同進程中的其他線程共享數據,但擁有自己的棧空間,擁有獨立的執行序列。


多線程的好處:
可以提高CPU的利用率。在多線程程序中,一個線程必須等待的時候,CPU可以運行其它的線程而不是等待,
這樣就大大提高了程序的效率。 

多線程的不利方面:
線程也是程序,所以線程需要佔用內存,線程越多佔用內存也越多; 
多線程需要協調和管理,所以需要CPU時間跟蹤線程; 
線程之間對共享資源的訪問會相互影響,必須解決競用共享資源的問題;
線程太多會導致控制太複雜,最終可能造成很多Bug

進程和線程的區別
    
   進程和線程的主要差別在於它們是不同的操作系統資源管理方式。進程有獨立的地址空間,一個進程崩潰後,在保護模式下不會對其它進程產生影響,而線程只是一個進程中的不同執行路徑。線程有自己的堆棧和局部變量,但線程之間沒有單獨的地址空間,一個線程死掉就等於整個進程死掉,所以多進程的程序要比多線程的程序健壯,但在進程切換時,耗費資源較大,效率要差一些。但對於一些要求同時進行並且又要共享某些變量的併發操作,只能用線程,不能用進程。

1) 簡而言之,一個程序至少有一個進程,一個進程至少有一個線程.

2) 線程的劃分尺度小於進程,使得多線程程序的併發性高。

3) 另外,進程在執行過程中擁有獨立的內存單元,而多個線程共享內存,從而極大地提高了程序的運行效率。

4) 線程在執行過程中與進程還是有區別的。每個獨立的線程有一個程序運行的入口、順序執行序列和程序的出口。但是線程不能夠獨立執行,必須依存在應用程序中,由應用程序提供多個線程執行控制。

5) 從邏輯角度來看,多線程的意義在於一個應用程序中,有多個執行部分可以同時執行。但操作系統並沒有將多個線程看做多個獨立的應用,來實現進程的調度和管理以及資源分配。這就是進程和線程的重要區別


優缺點

線程和進程在使用上各有優缺點:線程執行開銷小,但不利於資源的管理和保護;而進程正相反。同時,線程適合於在SMP機器上運行,而進程則可以跨機器遷移。


線程具有許多傳統進程所具有的特徵,故又稱爲輕型進程(Light—Weight Process)或進程元;而把傳統的進程稱爲重型進程(Heavy—Weight Process),它相當於只有一個線程的任務。在引入了線程的操作系統中,通常一個進程都有若干個線程,至少需要一個線程。下面,我們從調度、併發性、 系統開銷、擁有資源等方面,來比較線程與進程。
1.調度
在引入線程的操作系統中,則把線程作爲調度和分派的基本單位。而把進程作 爲資源擁有的基本單位,在同一進程中,線程的切換不會引起進程的切換,在 由一個進程中的線程切換到另一個進程中的線程時,將會引起進程的切換。
2.併發性
在引入線程的操作系統中,不僅進程之間可以併發執行,而且在一個進程中的多個線程之間,亦可併發執行,因而使操作系統具有更好的併發性,從而能更有效地使 用系統資源和提高系統吞吐量。例如,在一個未引入線程的單CPU操作系統中,若僅設置一個文件服務進程,當它由於某種原因而被阻塞時,便沒有其它的文件服 務進程來提供服務。在引入了線程的操作系統中,可以在一個文件服務進程中,設置多個服務線程,當第一個線程等待時,文件服務進程中的第二個線程可以繼續運 行;當第二個線程阻塞時,第三個線程可以繼續執行,從而顯著地提高了文件服務的質量以及系統吞吐量。
3.擁有資源
不論是傳統的操作系統,還是設有線程的操作系統,進程都是擁有資源的一個獨立單位,它可以擁有自己的資源。一般地說,線程自己不擁有系統資源(也有一點必 不可少的資源),但它可以訪問其隸屬進程的資源。亦即,一個進程的代碼段、數據段以及系統資源,如已打開的文件、I/O設備等,可供問一進程的其它所有線 程共享。
4.系統開銷
由於在創建或撤消進程時,系統都要爲之分配或回收資源,如內存空間、I/o設備等。因此,操作系統所付出的開銷將顯著地大於在創建或撤消線程時的開銷。類 似地,在進行進程切換時,涉及到整個當前進程CPU環境的保存以及新被調度運行的進程的CPU環境的設置。而線程切換隻須保存和設置少量寄存器的內容,並 不涉及存儲器管理方面的操作。可見,進程切換的開銷也遠大於線程切換的開銷。此外,由於同一進程中的多個線程具有相同的地址空間,致使它們之間的同步和通信的實現,也變得比較容易。在有的系統中,線程的切換、同步和通信都無須、


形象比喻

    進程(process)和線程(thread)是操作系統的基本概念,但是它們比較抽象,不容易掌握。

最近,我讀到一篇材料,發現有一個很好的類比,可以把它們解釋地清晰易懂。

   計算機的核心是CPU,它承擔了所有的計算任務。它就像一座工廠,時刻在運行。

   假定工廠的電力有限,一次只能供給一個車間使用。也就是說,一個車間開工的時候,其他車間都必須停工。背後的含義就是,單個CPU一次只能運行一個任務。

  進程就好比工廠的車間,它代表CPU所能處理的單個任務。任一時刻,CPU總是運行一個進程,其他進程處於非運行狀態。

  一個車間裏,可以有很多工人。他們協同完成一個任務。

  線程就好比車間裏的工人。一個進程可以包括多個線程。

  車間的空間是工人們共享的,比如許多房間是每個工人都可以進出的。這象徵一個進程的內存空間是共享的,每個線程都可以使用這些共享內存。

 可是,每間房間的大小不同,有些房間最多隻能容納一個人,比如廁所。裏面有人的時候,其他人就不能進去了。這代表一個線程使用某些共享內存時,其他線程必須等它結束,才能使用這一塊內存。

  一個防止他人進入的簡單方法,就是門口加一把鎖。先到的人鎖上門,後到的人看到上鎖,就在門口排隊,等鎖打開再進去。這就叫"互斥鎖"(Mutual exclusion,縮寫 Mutex),防止多個線程同時讀寫某一塊內存區域。

  還有些房間,可以同時容納n個人,比如廚房。也就是說,如果人數大於n,多出來的人只能在外面等着。這好比某些內存區域,只能供給固定數目的線程使用。

  這時的解決方法,就是在門口掛n把鑰匙。進去的人就取一把鑰匙,出來時再把鑰匙掛回原處。後到的人發現鑰匙架空了,就知道必須在門口排隊等着了。這種做法叫做"信號量"(Semaphore),用來保證多個線程不會互相沖突。

不難看出,mutex是semaphore的一種特殊情況(n=1時)。也就是說,完全可以用後者替代前者。但是,因爲mutex較爲簡單,且效率高,所以在必須保證資源獨佔的情況下,還是採用這種設計。

 

操作系統的設計,因此可以歸結爲三點:

(1)以多進程形式,允許多個任務同時運行;

(2)以多線程形式,允許單個任務分成不同的部分運行;

(3)提供協調機制,一方面防止進程之間和線程之間產生衝突,另一方面允許進程之間和線程之間共享資源。







發佈了29 篇原創文章 · 獲贊 40 · 訪問量 8萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章