你確定你會寫 Dockerfile?

本文使用一個基於 Maven 的 Java 項目作爲示例,然後不斷改進 Dockerfile 的寫法,直到最後寫出一個最優雅的 Dockerfile。中間的所有步驟都是爲了說明某一方面的最佳實踐。

b75d3b0bb9de43a180208a1abd3ce3c7

一、減少構建時間

一個開發週期包括構建 Docker 鏡像,更改代碼,然後重新構建 Docker 鏡像。在構建鏡像的過程中,如果能夠利用緩存,可以減少不必要的重複構建步驟。

1、構建順序影響緩存的利用率

f3fd046395c041c297256253ccabc9e1

鏡像的構建順序很重要,當你向 Dockerfile 中添加文件,或者修改其中的某一行時,那一部分的緩存就會失效,該緩存的後續步驟都會中斷,需要重新構建。所以優化緩存的最佳方法是把不需要經常更改的行放到最前面,更改最頻繁的行放到最後面。

2、只拷貝需要的文件,防止緩存溢出

9c8bfa272e124253bf7cb4d1e7d96b37

當拷貝文件到鏡像中時,儘量只拷貝需要的文件,切忌使用 COPY . 指令拷貝整個目錄。如果被拷貝的文件內容發生了更改,緩存就會被破壞。在上面的示例中,鏡像中只需要構建好的 jar 包,因此只需要拷貝這個文件就行了,這樣即使其他不相關的文件發生了更改也不會影響緩存。

3、最小化可緩存的執行層

8969d142fa7c4dddb0aa90ac6be950b0

每一個 RUN 指令都會被看作是可緩存的執行單元。太多的 RUN 指令會增加鏡像的層數,增大鏡像體積,而將所有的命令都放到同一個 RUN 指令中又會破壞緩存,從而延緩開發週期。當使用包管理器安裝軟件時,一般都會先更新軟件索引信息,然後再安裝軟件。推薦將更新索引和安裝軟件放在同一個 RUN 指令中,這樣可以形成一個可緩存的執行單元,否則你可能會安裝舊的軟件包。

二、 減小鏡像體積

鏡像的體積很重要,因爲鏡像越小,部署的速度更快,***範圍越小。

1、刪除不必要依賴

27081f60e32a4a2cba5ada48fe0b40b6

刪除不必要的依賴,不要安裝調試工具。如果實在需要調試工具,可以在容器運行之後再安裝。某些包管理工具(如 apt)除了安裝用戶指定的包之外,還會安裝推薦的包,這會無緣無故增加鏡像的體積。apt 可以通過添加參數 -–no-install-recommends 來確保不會安裝不需要的依賴項。如果確實需要某些依賴項,請在後面手動添加。

2、刪除包管理工具的緩存

19a8834d8bfd42579b2a27f91529ee62

包管理工具會維護自己的緩存,這些緩存會保留在鏡像文件中,推薦的處理方法是在每一個 RUN 指令的末尾刪除緩存。如果你在下一條指令中刪除緩存,不會減小鏡像的體積。

當然了,還有其他更高級的方法可以用來減小鏡像體積,如下文將會介紹的多階段構建。接下來我們將探討如何優化 Dockerfile 的可維護性、安全性和可重複性。

三、可維護性

1、儘量使用官方鏡像

6a10cc9bcb614a7d940dedeccfa3adbd

使用官方鏡像可以節省大量的維護時間,因爲官方鏡像的所有安裝步驟都使用了最佳實踐。如果你有多個項目,可以共享這些鏡像層,因爲他們都可以使用相同的基礎鏡像。

2、使用更具體的標籤

531ced37d5534e5188d5c55f9eaad879

基礎鏡像儘量不要使用 latest 標籤。雖然這很方便,但隨着時間的推移,latest 鏡像可能會發生重大變化。因此在 Dockerfile 中最好指定基礎鏡像的具體標籤。我們使用 openjdk 作爲示例,指定標籤爲 8。其他更多標籤請查看官方倉庫。

3、使用體積最小的基礎鏡像

1d41b9a565ae4c1db21bbc56e082a43e

基礎鏡像的標籤風格不同,鏡像體積就會不同。slim 風格的鏡像是基於 Debian 發行版製作的,而 alpine 風格的鏡像是基於體積更小的 Alpine Linux 發行版製作的。其中一個明顯的區別是:Debian 使用的是 GNU 項目所實現的 C 語言標準庫,而 Alpine 使用的是 Musl C 標準庫,它被設計用來替代 GNU C 標準庫(glibc)的替代品,用於嵌入式操作系統和移動設備。因此使用 Alpine 在某些情況下會遇到兼容性問題。 以 openjdk 爲例,jre 風格的鏡像只包含 Java 運行時,不包含 SDK,這麼做也可以大大減少鏡像體積。

四、重複利用

到目前爲止,我們一直都在假設你的 jar 包是在主機上構建的,這還不是理想方案,因爲沒有充分利用容器提供的一致性環境。例如,如果你的 Java 應用依賴於某一個特定的操作系統的庫,就可能會出現問題,因爲環境不一致(具體取決於構建 jar 包的機器)。

1、在一致的環境中從源代碼構建

源代碼是你構建 Docker 鏡像的最終來源,Dockerfile 裏面只提供了構建步驟。

08a3205192ed4d31ab4ba0951d00a83a

首先應該確定構建應用所需的所有依賴,本文的示例 Java 應用很簡單,只需要 Maven 和 JDK,所以基礎鏡像應該選擇官方的體積最小的 maven 鏡像,該鏡像也包含了 JDK。如果你需要安裝更多依賴,可以在 RUN 指令中添加。pom.xml 文件和 src 文件夾需要被複制到鏡像中,因爲最後執行 mvn package 命令(-e 參數用來顯示錯誤,-B 參數表示以非交互式的“批處理”模式運行)打包的時候會用到這些依賴文件。

雖然現在我們解決了環境不一致的問題,但還有另外一個問題:**每次代碼更改之後,都要重新獲取一遍 pom.xml 中描述的所有依賴項。**下面我們來解決這個問題。

2、在單獨的步驟中獲取依賴項

f32d4e2d4b504ba389e57d88f8abb99b

結合前面提到的緩存機制,我們可以讓獲取依賴項這一步變成可緩存單元,只要 pom.xml 文件的內容沒有變化,無論代碼如何更改,都不會破壞這一層的緩存。上圖中兩個 COPY 指令中間的 RUN 指令用來告訴 Maven 只獲取依賴項。

現在又遇到了一個新問題:跟之前直接拷貝 jar 包相比,鏡像體積變得更大了,因爲它包含了很多運行應用時不需要的構建依賴項。

3、使用多階段構建來刪除構建時的依賴項

a66f702ac4e64293beb74e0177d717ac

多階段構建可以由多個 FROM 指令識別,每一個 FROM 語句表示一個新的構建階段,階段名稱可以用 AS 參數指定。本例中指定第一階段的名稱爲 builder,它可以被第二階段直接引用。兩個階段環境一致,並且第一階段包含所有構建依賴項。

第二階段是構建最終鏡像的最後階段,它將包括應用運行時的所有必要條件,本例是基於 Alpine 的最小 JRE 鏡像。上一個構建階段雖然會有大量的緩存,但不會出現在第二階段中。爲了將構建好的 jar 包添加到最終的鏡像中,可以使用 COPY --from=STAGE_NAME 指令,其中 STAGE_NAME 是上一構建階段的名稱。

0c0b7d0bfbe84285acfa52b864a1e78f

階段構建是刪除構建依賴的首選方案。本文從在非一致性環境中構建體積較大的鏡像開始優化,一直優化到在一致性環境中構建最小鏡像,同時充分利用了緩存機制。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章