10張圖帶你深入理解Docker容器和鏡像

這篇文章希望能夠幫助讀者深入理解Docker的命令,還有容器(container)和鏡像(image)之間的區別,並深入探討容器和運行中的容器之間的區別。
 

pasted_image_0.png



當我對Docker技術還是一知半解的時候,我發現理解Docker的命令非常困難。於是,我花了幾周的時間來學習Docker的工作原理,更確切地說,是關於Docker統一文件系統(the union file system)的知識,然後回過頭來再看Docker的命令,一切變得順理成章,簡單極了。

題外話:就我個人而言,掌握一門技術併合理使用它的最好辦法就是深入理解這項技術背後的工作原理。通常情況下,一項新技術的誕生常常會伴隨着媒體的大肆宣傳和炒作,這使得用戶很難看清技術的本質。更確切地說,新技術總是會發明一些新的術語或者隱喻詞來幫助宣傳,這在初期是非常有幫助的,但是這給技術的原理蒙上了一層砂紙,不利於用戶在後期掌握技術的真諦。

Git就是一個很好的例子。我之前不能夠很好的使用Git,於是我花了一段時間去學習Git的原理,直到這時,我才真正明白了Git的用法。我堅信只有真正理解Git內部原理的人才能夠掌握這個工具。

Image Definition

鏡像(Image)就是一堆只讀層(read-only layer)的統一視角,也許這個定義有些難以理解,下面的這張圖能夠幫助讀者理解鏡像的定義。
 

1.png



從左邊我們看到了多個只讀層,它們重疊在一起。除了最下面一層,其它層都會有一個指針指向下一層。這些層是Docker內部的實現細節,並且能夠在主機(譯者注:運行Docker的機器)的文件系統上訪問到。統一文件系統(union file system)技術能夠將不同的層整合成一個文件系統,爲這些層提供了一個統一的視角,這樣就隱藏了多層的存在,在用戶的角度看來,只存在一個文件系統。我們可以在圖片的右邊看到這個視角的形式。

你可以在你的主機文件系統上找到有關這些層的文件。需要注意的是,在一個運行中的容器內部,這些層是不可見的。在我的主機上,我發現它們存在於/var/lib/docker/aufs目錄下。


 

sudo tree -L 1 /var/lib/docker/

/var/lib/docker/ ├── aufs ├── containers ├── graph ├── init ├── linkgraph.db ├── repositories-aufs ├── tmp ├── trust └── volumes 7 directories, 2 files

Container Definition

容器(container)的定義和鏡像(image)幾乎一模一樣,也是一堆層的統一視角,唯一區別在於容器的最上面那一層是可讀可寫的。
 

2.png



細心的讀者可能會發現,容器的定義並沒有提及容器是否在運行,沒錯,這是故意的。正是這個發現幫助我理解了很多困惑。

要點:容器 = 鏡像 + 讀寫層。並且容器的定義並沒有提及是否要運行容器。

接下來,我們將會討論運行態容器。

Running Container Definition

一個運行態容器(running container)被定義爲一個可讀寫的統一文件系統加上隔離的進程空間和包含其中的進程。下面這張圖片展示了一個運行中的容器。
 

3.png



正是文件系統隔離技術使得Docker成爲了一個前途無量的技術。一個容器中的進程可能會對文件進行修改、刪除、創建,這些改變都將作用於可讀寫層(read-write layer)。下面這張圖展示了這個行爲。
 

4.png



我們可以通過運行以下命令來驗證我們上面所說的:

docker run ubuntu touch happiness.txt


即便是這個ubuntu容器不再運行,我們依舊能夠在主機的文件系統上找到這個新文件。


 

find / -name happiness.txt

/var/lib/docker/aufs/diff/860a7b...889/happiness.txt

Image Layer Definition

爲了將零星的數據整合起來,我們提出了鏡像層(image layer)這個概念。下面的這張圖描述了一個鏡像層,通過圖片我們能夠發現一個層並不僅僅包含文件系統的改變,它還能包含了其他重要信息。
 

5.png



元數據(metadata)就是關於這個層的額外信息,它不僅能夠讓Docker獲取運行和構建時的信息,還包括父層的層次信息。需要注意,只讀層和讀寫層都包含元數據。
 

6.png



除此之外,每一層都包括了一個指向父層的指針。如果一個層沒有這個指針,說明它處於最底層。
 

8.png



Metadata Location:
我發現在我自己的主機上,鏡像層(image layer)的元數據被保存在名爲”json”的文件中,比如說:

/var/lib/docker/graph/e809f156dc985.../json


e809f156dc985...就是這層的id

一個容器的元數據好像是被分成了很多文件,但或多或少能夠在/var/lib/docker/containers/<id>目錄下找到,<id>就是一個可讀層的id。這個目錄下的文件大多是運行時的數據,比如說網絡,日誌等等。

全局理解(Tying It All Together)

現在,讓我們結合上面提到的實現細節來理解Docker的命令。
 

docker create <image-id>

create.jpg


docker create 命令爲指定的鏡像(image)添加了一個可讀寫層,構成了一個新的容器。注意,這個容器並沒有運行。
 

11.png


 

docker start <container-id>

start.jpg


Docker start命令爲容器文件系統創建了一個進程隔離空間。注意,每一個容器只能夠有一個進程隔離空間。
 

docker run <image-id>

run.jpg


看到這個命令,讀者通常會有一個疑問:docker start 和 docker run命令有什麼區別。
 

7.png



從圖片可以看出,docker run 命令先是利用鏡像創建了一個容器,然後運行這個容器。這個命令非常的方便,並且隱藏了兩個命令的細節,但從另一方面來看,這容易讓用戶產生誤解。

題外話:繼續我們之前有關於Git的話題,我認爲docker run命令類似於git pull命令。git pull命令就是git fetch 和 git merge兩個命令的組合,同樣的,docker run就是docker create和docker start兩個命令的組合。
 

docker ps

ps.jpg


docker ps 命令會列出所有運行中的容器。這隱藏了非運行態容器的存在,如果想要找出這些容器,我們需要使用下面這個命令。
 

docker ps –a

ps0a.jpg


docker ps –a命令會列出所有的容器,不管是運行的,還是停止的。
 

docker images

images.jpg


docker images命令會列出了所有頂層(top-level)鏡像。實際上,在這裏我們沒有辦法區分一個鏡像和一個只讀層,所以我們提出了top-level鏡像。只有創建容器時使用的鏡像或者是直接pull下來的鏡像能被稱爲頂層(top-level)鏡像,並且每一個頂層鏡像下面都隱藏了多個鏡像層。
 

docker images –a

images-a.jpg


docker images –a命令列出了所有的鏡像,也可以說是列出了所有的可讀層。如果你想要查看某一個image-id下的所有層,可以使用docker history來查看。
 

docker stop <container-id>

stop.jpg


docker stop命令會向運行中的容器發送一個SIGTERM的信號,然後停止所有的進程。
 

docker kill <container-id>

kill.jpg


docker kill 命令向所有運行在容器中的進程發送了一個不友好的SIGKILL信號。
 

docker pause <container-id>

pause.jpg


docker stop和docker kill命令會發送UNIX的信號給運行中的進程,docker pause命令則不一樣,它利用了cgroups的特性將運行中的進程空間暫停。具體的內部原理你可以在這裏找到:https://www.kernel.org/doc/Doc ... m.txt,但是這種方式的不足之處在於發送一個SIGTSTP信號對於進程來說不夠簡單易懂,以至於不能夠讓所有進程暫停。
 

docker rm <container-id>

rm.jpg


docker rm命令會移除構成容器的可讀寫層。注意,這個命令只能對非運行態容器執行。
 

docker rmi <image-id>

rmi.jpg


docker rmi 命令會移除構成鏡像的一個只讀層。你只能夠使用docker rmi來移除最頂層(top level layer)(也可以說是鏡像),你也可以使用-f參數來強制刪除中間的只讀層。 
 

docker commit <container-id>

commit.jpg


docker commit命令將容器的可讀寫層轉換爲一個只讀層,這樣就把一個容器轉換成了不可變的鏡像。
 

10.png


 

docker build

build.jpg


docker build命令非常有趣,它會反覆的執行多個命令。
 

9.png



我們從上圖可以看到,build命令根據Dockerfile文件中的FROM指令獲取到鏡像,然後重複地1)run(create和start)、2)修改、3)commit。在循環中的每一步都會生成一個新的層,因此許多新的層會被創建。
 

docker exec <running-container-id>

exec.jpg


docker exec 命令會在運行中的容器執行一個新進程。
 

docker inspect <container-id> or <image-id>

insepect.jpg


docker inspect命令會提取出容器或者鏡像最頂層的元數據。
 

docker save <image-id>

save.jpg


docker save命令會創建一個鏡像的壓縮文件,這個文件能夠在另外一個主機的Docker上使用。和export命令不同,這個命令爲每一個層都保存了它們的元數據。這個命令只能對鏡像生效。
 

docker export <container-id>

export.jpg


docker export命令創建一個tar文件,並且移除了元數據和不必要的層,將多個層整合成了一個層,只保存了當前統一視角看到的內容(譯者注:expoxt後的容器再import到Docker中,通過docker images –tree命令只能看到一個鏡像;而save後的鏡像則不同,它能夠看到這個鏡像的歷史鏡像)。
 

docker history <image-id>

history.jpg


docker history命令遞歸地輸出指定鏡像的歷史鏡像。
 

結論

我希望你們能喜歡這篇文章。還有其他許多的命令(pull,search,restart,attach等)我沒有提及,但是我相信通過閱讀這篇文章,大部分的Docker命令都能夠被很好理解。我僅僅學習了Docker兩個星期,因此,如果我有什麼地方說的不好,歡迎大家指出。

原文鏈接:Visualizing Docker Containers and Images(翻譯:楊潤青)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章