進程與線程的一個簡單解釋

進程(process)和線程(thread)是操作系統的基本概念,但是它們比較抽象,不容易掌握。

最近,我讀到一篇材料,發現有一個很好的類比,可以把它們解釋地清晰易懂。

1.

計算機的核心是CPU,它承擔了所有的計算任務。它就像一座工廠,時刻在運行。

2.

假定工廠的電力有限,一次只能供給一個車間使用。也就是說,一個車間開工的時候,其他車間都必須停工。背後的含義就是,單個CPU一次只能運行一個任務。

3.

進程就好比工廠的車間,它代表CPU所能處理的單個任務。任一時刻,CPU總是運行一個進程,其他進程處於非運行狀態。

4.

一個車間裏,可以有很多工人。他們協同完成一個任務。

5.

線程就好比車間裏的工人。一個進程可以包括多個線程。

6.

車間的空間是工人們共享的,比如許多房間是每個工人都可以進出的。這象徵一個進程的內存空間是共享的,每個線程都可以使用這些共享內存。

7.

可是,每間房間的大小不同,有些房間最多隻能容納一個人,比如廁所。裏面有人的時候,其他人就不能進去了。這代表一個線程使用某些共享內存時,其他線程必須等它結束,才能使用這一塊內存。

8.

一個防止他人進入的簡單方法,就是門口加一把鎖。先到的人鎖上門,後到的人看到上鎖,就在門口排隊,等鎖打開再進去。這就叫"互斥鎖"(Mutual exclusion,縮寫 Mutex),防止多個線程同時讀寫某一塊內存區域。

9.

還有些房間,可以同時容納n個人,比如廚房。也就是說,如果人數大於n,多出來的人只能在外面等着。這好比某些內存區域,只能供給固定數目的線程使用。

10.

這時的解決方法,就是在門口掛n把鑰匙。進去的人就取一把鑰匙,出來時再把鑰匙掛回原處。後到的人發現鑰匙架空了,就知道必須在門口排隊等着了。這種做法叫做"信號量"(Semaphore),用來保證多個線程不會互相沖突。

不難看出,mutex是semaphore的一種特殊情況(n=1時)。也就是說,完全可以用後者替代前者。但是,因爲mutex較爲簡單,且效率高,所以在必須保證資源獨佔的情況下,還是採用這種設計。

11.

操作系統的設計,因此可以歸結爲三點:

(1)以多進程形式,允許多個任務同時運行;

(2)以多線程形式,允許單個任務分成不同的部分運行;

(3)提供協調機制,一方面防止進程之間和線程之間產生衝突,另一方面允許進程之間和線程之間共享資源。

拋開各種技術細節,從應用程序角度講:

1、在單核計算機裏,有一個資源是無法被多個程序並行使用的:cpu。

沒有操作系統的情況下,一個程序一直獨佔着全都cpu。

如果要有兩個任務來共享同一個CPU,程序員就需要仔細地爲程序安排好運行計劃--某時刻cpu和由程序A來獨享,下一時刻cpu由程序B來獨享

而這種安排計劃後來成爲OS的核心組件,被單獨名命爲“scheduler”,即“調度器”,它關心的只是怎樣把單個cpu的運行拆分成一段一段的“運行片”,輪流分給不同的程序去使用,而在宏觀上,因爲分配切換的速度極快,就製造出多程序並行在一個cpu上的假象。

2、在單核計算機裏,有一個資源可以被多個程序共用,然而會引出麻煩:內存。

在一個只有調度器,沒有內存管理組件的操作系統上,程序員需要手工爲每個程序安排運行的空間 -- 程序A使用物理地址0x00-0xff,程序B使用物理地址0x100-0x1ff,等等。

然而這樣做有個很大的問題:每個程序都要協調商量好怎樣使用同一個內存上的不同空間,軟件系統和硬件系統千差萬別,使這種定製的方案沒有可行性。
爲了解決這個麻煩,計算機系統引入了“虛擬地址”的概念,從三方面入手來做:

2.1、硬件上,CPU增加了一個專門的模塊叫MMU,負責轉換虛擬地址和物理地址。
2.2、操作系統上,操作系統增加了另一個核心組件:memory management,即內存管理模塊,它管理物理內存、虛擬內存相關的一系列事務。
2.3、應用程序上,發明了一個叫做【進程】的模型,(注意)每個進程都用【完全一樣的】虛擬地址空間,然而經由操作系統和硬件MMU協作,映射到不同的物理地址空間上。不同的【進程】,都有各自獨立的物理內存空間,不用一些特殊手段,是無法訪問別的進程的物理內存的。

3、現在,不同的應用程序,可以不關心底層的物理內存分配,也不關心CPU的協調共享了。然而還有一個問題存在:有一些程序,想要共享CPU,【並且還要共享同樣的物理內存】,這時候,一個叫【線程】的模型就出現了,它們被包裹在進程裏面,在調度器的管理下共享CPu,擁有同樣的虛擬地址空間,同時也共享同一個物理地址空間,然而,它們無法越過包裹自己的進程,去訪問別一個進程的物理地址空間。

4、進程之間怎樣共享同一個物理地址空間呢?不同的系統方法各異,符合posix規範的操作系統都提供了一個接口,叫mmap,可以把一個物理地址空間映射到不同的進程中,由不同的進程來共享。

5、PS:在有的操作系統裏,進程不是調度單位(即不能被調度器使用),線程是最基本的調度單位,調度器只調度線程,不調度進程,比如VxWorks


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章