這些IO模型你都知道嗎 - 五種常見IO模型介紹

面試的時候也許你被問到過IO模型,可能你知道有五種,可是卻不一定能準確指出他們之間的關係,下面我們介紹下這五種IO模型

五種IO模型

  1. 阻塞IO

  2. 非阻塞IO

  3. IO複用(select和poll)

  4. 信號驅動

  5. 異步IO(Posix.1 的 aio...系列函數)

備註

一個輸入操作一般分爲兩個階段:

  1. 等待數據準備好

  2. 把數據從內核拷貝到進程

一個套接字的輸入操作,第一步是等待數據到達網絡,當分組到達時,它被拷貝到內核中的某個緩衝區,第二步是將數據從內核緩衝區拷貝到應用緩衝區

那我們來分別看下這五種IO模型

阻塞IO模型

阻塞IO是最通用的IO模型,使用該模型接收數據時,在數據沒有到之前程序會一直等待。例如函數recvfrom,內核會一直阻塞該請求直到有數據到才返回,如下圖所示:

如上圖所示,進程在調用recvfrom時,該系統調用直到數據到達且拷貝到應用緩衝區或出錯才返回。那阻塞的時間就是從調用recvfrom開始到返回的這段時間,當進程返回成功指示時,應用進程開始處理數據報。

非阻塞IO模型

當把套接字設置成非阻塞方式時,即通知內核:當請求的IO操作非得讓進程睡眠不能完成時,不要讓進程睡眠,而應返回一個錯誤,直到數據準備好,並將數據拷貝到應用緩衝區返回成功指示,進程調用結束。如下圖所示:

從圖中我們可以看出,進程會反覆調用recvfrom,前三次調用一直沒有數據返回,因此立即返回一個EWOULDBLOCK錯誤,在第四次調用的時候,數據才準備好,並拷貝到了應用緩衝區,recvfrom返回成功指示,然後就時進程處理數據

當一個應用進程像這樣對一個非阻塞描述字循環調用recvfrom時,我們稱之爲輪訓。應用進程連續不斷的查詢內核,驗證某操作是否準備好,這樣會極大的浪費CPU的時間

IO複用模型

IO複用模型支持調用select或poll,會阻塞在select或poll上,而不是阻塞於真正的IO系統調用。阻塞在select調用,等待數據報套接口可讀。當select返回套接口可讀條件時,再調用recvfrom將數據拷貝到應用緩衝區。如下入所示:

通過阻塞IO模型和IO複用模型的對比,我們發現由之前的一次系統調用變成了兩次系統調用,好像變差了,其實並沒有,select可以等待多個描述字準備好,同時select可以設置超時時間。

信號驅動IO模型

信號驅動IO是讓內核在描述字準備好時用信號SIGIO通知我們。首先允許套接口進行信號驅動IO,然後通過系統調用sigacation安裝信號處理程序。此係統調用立即返回,進程繼續工作,是非阻塞的。當數據報準備好被讀時,爲該進程生成一個SIGIO信號,隨後在信號處理程序中調用recvfrom讀取數據報,並通知主循環數據已經準備好被處理或者通知主循環讓它來讀取數據報,如下圖所示:

異步IO模型

異步IO讓內核啓動操作,並在整個操作完成後(包括將數據從內核拷貝到用戶空間)通知我們。如下圖所示:

異步IO模型和信號驅動IO模型的主要區別是:信號驅動IO是由內核通知我們何時啓動IO操作,而異步IO是由內核通知我們IO操作何時完成

五種IO模型的對比

通過上面對五種IO模型的介紹,我們發現前四種IO模型的主要區別點在於第一階段,第二階段基本相同:在數據從內核拷貝到調用者的緩衝區時,進程阻塞在recvfrom調用。異步IO模型的兩個階段是和前四種不同的,對比如下圖所示:

我們發現五種IO模型沒有提到同步IO模型,卻提到了異步IO模型,這是爲什麼?

首先我們看下Posix對同步IO和異步IO的定義:

同步IO操作引起請求進程阻塞,直到IO操作完成

異步IO操作不引起請求進程阻塞

我們可以發現,根據上面的定義,前四種模式:阻塞IO模型、非阻塞IO模型、IO多路複用模型和信號驅動模型,其實都屬於同步IO模型,因爲他們四個都會經歷真正的IO操作(recvfrom)且阻塞了進程,只有異步IO模型與異步IO的定義匹配

參考資料

《UNIX網絡編程:卷1》

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章