利用Docker構建開發環境

轉載至:http://tech.uc.cn/?p=2726


最近接觸PAAS相關的知識,在研發過程中開始使用Docker搭建了自己完整的開發環境,感覺生活在PAAS時代的程序員真是幸福,本文會簡要介紹下Docker是什麼,如何利用Docker來搭建自己的開發環境(本文主要是面向Mac OS X),以及期間所遇到的一些坑和解決方案。(本文會要求你對PAAS、LXC、CGroup、AUFS有一定的瞭解基礎,請自行Google )

大背景–虛擬化技術歷史

計算機虛擬化技術由來已久,從硬件仿真到全虛擬化,再到準虛擬化和操作系統虛擬化,各種技術粉墨登場,種類繁多,說實在的有點眼花繚亂和複雜;但用戶的核心訴求一直是比較簡單的,降低信息技術(IT)的運營成本,提高資源利用率,提高安全性和可靠性等等;雖說用戶的核心訴求比較簡單,但每個時代的需求場景卻是不同的。在大型機時代,虛擬化技術被用來支持多個用戶能夠同時使用大型機,在x86架構時代,隨着企業服務的大規模部署,虛擬化技術主要是用來提高企業資源的利用率,而現如今,隨着雲計算時代的到來,人們對應用的安全性、隔離性越來越高,對於部署的標準化以及虛擬機的性能要求越來越高。現如今,一種叫Linux容器的虛擬化技術逐漸得到廣泛的應用,它的優點有許多,本文不一一贅述,有太多的文章可以參考。

什麼是Docker?

docker的英文本意是碼頭工人,也就是搬運工,這種搬運工搬運的是集裝箱(Container),集裝箱裏面裝的可不是商品貨物,而是任意類型的App,Docker把App(叫Payload)裝在Container內,通過Linux Container技術的包裝將App變成一種標準化的、可移植的、自管理的組件,這種組件可以在你的latop上開發、調試、運行,最終非常方便和一致地運行在production環境下。

Docker的核心底層技術是LXC(Linux Container),Docker在其上面加了薄薄的一層,添加了許多有用的功能。這篇stackoverflow上的問題和答案很好地詮釋了Docker和LXC的區別,能夠讓你更好的瞭解什麼是Docker, 簡單翻譯下就是以下幾點:

  • Docker提供了一種可移植的配置標準化機制,允許你一致性地在不同的機器上運行同一個Container;而LXC本身可能因爲不同機器的不同配置而無法方便地移植運行;
  • Docker以App爲中心,爲應用的部署做了很多優化,而LXC的幫助腳本主要是聚焦於如何機器啓動地更快和耗更少的內存;
  • Docker爲App提供了一種自動化構建機制(Dockerfile),包括打包,基礎設施依賴管理和安裝等等;
  • Docker提供了一種類似git的Container版本化的機制,允許你對你創建過的容器進行版本管理,依靠這種機制,你還可以下載別人創建的Container,甚至像git那樣進行合併;
  • Docker Container是可重用的,依賴於版本化機制,你很容易重用別人的Container(叫Image),作爲基礎版本進行擴展;
  • Docker Container是可共享的,有點類似github一樣,Docker有自己的INDEX,你可以創建自己的Docker用戶並上傳和下載Docker Image;
  • Docker提供了很多的工具鏈,形成了一個生態系統;這些工具的目標是自動化、個性化和集成化,包括對PAAS平臺的支持等;

那麼Docker有什麼用呢?對於運維來說,Docker提供了一種可移植的標準化部署過程,使得規模化、自動化、異構化的部署成爲可能甚至是輕鬆簡單的事情;而對於開發者來說,Docker提供了一種開發環境的管理方法,包括映像、構建、共享等功能,而後者是本文的主題。

Docker的安裝和構成

Docker官方本身提供了非常具體的安裝教程,這裏不說具體的安裝過程,請參考Docker安裝(Mac系統),重要的是描述下原理和安裝完成後的結構,好對Docker更好的瞭解。 由於LXC本身不支持Mac內核,因此需要跑一個VirtualBox虛擬機(TinyCoreLinux)來安裝,幸好Docker社區提供了一個非常方便的工具boot2docker(其實就是一個VBoxManage的包裝shell腳本),用於安裝Mac下的整個Docker環境。具體的結構如下:

docker-install

如圖所示,安裝完成後,具體情況如下:

  • 在Mac的home目錄~/.boot2docker下創建了虛擬機所需要的文件,其中boot2docker.iso是虛擬機映像,這是一個由CD-ROM引導的TinyCoreLinux系統;而boot2docker-vm.vmdk文件則是你的虛擬機磁盤,你所有的持久化數據都存放在這裏,包括docker創建的lxc容器等文件。
  • 在Mac下,docker被分爲客戶端docker-client和服務端docker-daemon兩部分,如果是在linux(比如ubuntu),實際上則是同一個可執行文件同時充當客戶端和服務端。docker-daemon可以監聽unix scoket,也可以在tcp socket(默認端口爲4234),docker-client會通過一個叫DOCKER_HOST的環境變量讀取服務地址和端口,因此你應該在你的bash_profile文件裏面添加這麼一行:

docker-daemon跑在虛擬機上,這個程序實際上就是接收docker-client發送過來的消息命令,創建、啓動和銷燬lxc容器,以及docker本身的版本管理、映像存儲等等 運行你的第一個docker容器 安裝完成後,就差不多可以開始創建和運行docker容器了,在這之前,你首先得下載一個Image,什麼是Image?我們先來了解docker的2個基礎概念:ImageContainer

Container和Image 在Docker的世界裏,Image是指一個只讀的層(Layer),這裏的層是AUFS裏的概念,最直觀的方式就是看一下docker官方給出的圖:

docker-filesystems-multilayer

Docker使用了一種叫AUFS的文件系統,這種文件系統可以讓你一層一層地疊加修改你的文件,最底下的文件系統是隻讀的,如果需要修改文件,AUFS會增加一個可寫的層(Layer),這樣有很多好處,例如不同的Container可以共享底層的只讀文件系統(同一個Kernel),使得你可以跑N多個Container而不至於你的硬盤被擠爆了!這個只讀的層就是Image!而如你所看到的,一個可寫的層就是Container。

那Image和Container的區別是什麼?很簡單,他們的區別僅僅是一個是隻讀的層,一個是可寫的層,你可以使用docker commit 命令,將你的Container變成一個Image,也就是提交你所運行的Container的修改內容,變成一個新的只讀的Image,這非常類似於git commit命令,感覺真棒!

實際上這就是Docker對Container映像的版本管理基石,AUFS文件系統實在是太美妙了,更多細節可以參考DotCloud的這篇文章

運行和退出

在瞭解了Image和Container的概念後,我們可以開始下載一個Image,Docker的好處就是提供了一個類似github的Image倉庫管理,你可以非常方便pull別人的Image下來運行,例如,我們可以下載一個ubuntu Image:

這裏的13.10是一個Tag,類似於git的tag,這裏的tag可以爲你制定一個ubuntu的版本。下載完成後,執行docker images命令可以列出你已經下載或者自己構建的image:(請允許我使用可愛的馬賽克 :) )

QQ20140322-1

你可以看到ubuntu:13.10的大小爲178MB,以及它的IMAGE ID。 現在我們開始運行一個Container,命令很簡單,例如我們想運行一個執行Shell終端的Container:

QQ20140322-2

如你看到的,你已經進入到一個Shell裏面,可以執行你想執行的任何命令,就和在ubuntu裏面一樣,進去後默認是在根目錄/下,可以看到經典的unix/linux目錄結構,以及你所運行的bash版本等信息。你可以給你的Container定一個名字,通過–name選項,例如這裏命名了shell,日後你就可以直接用這個名字引用Contanier。

退出一個Container也很簡單,你直接exit就好了。 其他更多的命令這裏不做贅述,因爲官方的文檔已經非常全面,這裏只是給一個直觀的初步印象。下面進入主題。

利用Docker搭建開發環境

我們先看看程序員在搭建開發環境時遇到的一些問題:

  • 軟件安裝麻煩,比如很多公司都使用redhat,一般開發人員又不給root,安裝一個nginx或者是mysql都得自己下載編譯安裝 權限問題,沒有root,一些軟件無法運行,例如dnsmasq;
  • 沒有root,無法修改hosts,無法netstat -nptl,無法tcpdump,無法iptable
  • 隔離性差,例如不同的開發人員如果在同一臺主機環境下共享開發,雖然是用戶隔離,但端口如果不規範可能會衝突;同一個Mysql如果權限管理不好很有可能誤刪別人的數據
  • 可移植性差,例如和生產環境不一致,開發人員之間也無法共享;更嚴重的情況是當有新人入職時,通常需要又折騰一遍開發環境,無法快速搭建

這些問題可以通過在本地搭建虛擬機來解決,但虛擬機是一個很笨重的解決方案,Docker是一個非常輕量級的方案,而且還擁有虛擬機沒有的一些功能,例如標準化Image,Image共享等,更重要的是,利用Docker,你可以運行非常多的容器,在你的Mac下搭建一個分佈式的開發環境根本不是什麼大的問題,而且對內存、磁盤和cpu的消耗相比傳統的虛擬機要低許多,這些都要歸功於AUFS和LXC這兩大神奇的技術。

構建基礎Image

想要搭建一個節省磁盤空間和擴展性良好的開發環境,最重要的第一步就是構建一個基礎性的Image,比如你的主要開發語言是Ruby,那麼你肯定需要一個已經安裝好以下工具的基礎Image:

  • ruby
  • bundler
  • gem

然後在此基礎上,你可以擴展這個基礎的Image(下面叫base)爲不同的開發環境,例如rails,或者是nats。當然,你的這個base也可以從別人的Image擴展而來,還記得我們剛剛pull下來的ubuntu:13.10這個Image嗎?你可以從這個Image擴展開始構建你的base,如何做呢?Docker提供了一種標準化的DSL方式,你只需要編寫一個Dockerfile,運行docker build指令,就可以構建你自己的Image,這有點像Makefile和make命令一樣,只是大家要構建的內容和構建語言不同。

Dockerfile的語法請參考Dockerfile Reference,這裏給出上面提到的Ruby開發的base Dockerfile示例:

這裏只用到了很簡單的2個指令:FROM和RUN,FROM指定了我們要擴展的Image,RUN指定我們要運行的命令,這裏是安裝ruby,gem、bundler等軟件。寫好Dockerfile後,運行以下指令就可以創建你的base image了:

-t 選項是你要構建的base image的tag,就好比ubuntu:13.10一樣 –rm 選項是告訴Docker在構建完成後刪除臨時的Container,Dockerfile的每一行指令都會創建一個臨時的Container,一般你是不需要這些臨時生成的Container的 如你所想,我們可以像運行ubuntu:13.10那樣運行我們的base了:

這裏我們使用dev:base這個Image運行了一個irb解釋器(Ruby的交互式解釋器)。 在構建完base之後,你可以依樣畫葫蘆構建你的rails環境,很簡單,只需要FROM dev:base,然後RUN安裝你的rails組件就可以了,不再贅述。最終你可能構建的開發環境是這樣的:

docker-dev

如上圖所示,base和service都是從ubutnu:13.10繼承而來,他們作爲不同的基礎開發環境,base是ruby開發環境(也許命名爲dev:ruby更爲合適?),而service是一些基礎數據服務,例如mysql,memcache,我建議將這些第三方組件集中在一個Container中,因爲他們的環境不經常修改,可以作爲一種底層服務Container運行,除非你需要構建分佈式的服務,例如memcache集羣,那可以繼續拆分。

指定Image入口

當你構建完你的base Image和其他應用的Image之後,你就可以啓動這些Image了,還記得前面我們給出的運行命令嗎?

這裏我們運行了一個bash,這樣你就可以在shell裏面執行你所想要執行的任何命令了,但是我們有時候並不想每次都啓動一個shell,接着再在shell裏面啓動我們的程序,比如一個mysql,而是想一啓動一個容器,mysql服務就自動運行了,這很簡單,Dockerfile提供了CMD和ENTRYPOINT這2個指令,允許你指定一個Image啓動時的默認命令。CMD和ENTRYPOINT的區別是CMD的參數可以由docker run指令指定的參數覆蓋,而ENTRYPOINT則不可以。例如我們想運行一個memcached服務,可以這麼寫Dockerfile:

或者可以這麼寫:

注意不要把memcached啓動爲後臺進程,即加上-d選項,否則docker啓動的container會馬上stop掉,這點我也覺得比較意外。 接着我們build這個Image:

這樣,當你build完你的Image後,你可以直接將該Image運行爲一個容器,它會自動啓動mysql服務:

注意使用-d (detach) 選項,這樣這個container就會作爲後臺進程運行了,接着你可以使用docker ps命令查看是否有在運行。

磁盤映射

大部分時候你會需要把你host主機(宿主)上的目錄映射到Container裏面,這樣你就非常方便地在host主機上編輯代碼,然後直接就可以在Container裏面運行它們,而不用手動copy到Container裏面再重啓Container。按理將host的目錄映射到guest(指Container)上應該是一件很容易的事情,就好像VMWare那樣,但可惜的是,由於Mac上的Docker多了一層虛擬機,因此多了一層周折,你必須先VM上的目錄通過sshfs mount到host(指Mac)上,然後再將你的目錄或文件copy到這個mount的目錄,再將VM上的這個目錄映射到Container裏,聽起來比較拗口,畫個圖會清晰很多。

docker-disk-map

如上圖所示,VM裏面的/mnt/sda1/dev/目錄(你需要自己創建)通過sshfs命令mount到了host主機(Mac)的~/workspace/dev/目錄 ,而VM裏的/mnt/sda1/dev/目錄又被映射到了Container的/src/目錄下,這樣你就可以在Container裏面的/src/目錄下訪問你的host文件了。具體如何做呢?首先你需要安裝sshfs命令,然後將VM的password寫到一個文件中,例如~/.boot2docker/b2d-passwd,在用sshfs命令mount起VM的/mnt/sda1/dev目錄:

接着你在run一個Container的時候需要通過-v選項來將/mnt/sda1/dev/映射到/src目錄:

這樣你就可以在你的Container的/src目錄下看到你host裏的文件了。 磁盤映射還有2個地方需要注意:

  • 你的文件實際上是存儲在VM裏面的,也就是說你需要將你的目錄或者文件copy到VM裏面,你sshfs之後,就是copy到~/workspace/dev目錄下
  • 千萬不要sshfs mount非/mnt/sda1下的目錄,因爲VM裏面跑的是TinyCoreLinux,這個OS的rootfs是臨時性的(放在內存的,實際上就是boot2docker.iso文件裏面的一個rootfs),因此其根目錄/下的東西(包括/home)根本不會持久化,只有/mnt/sda1這個目錄下的才能持久化。如果你放在/home目錄下,只要VM一重啓,就會丟失的,/mnt/sda1則不會,實際上就是那個~/.boot2docker-vm.vmdk文件掛載到了/mnt/sda1目錄下

端口映射

和磁盤映射一樣,你有時候會需要將Container的端口映射到host主機上,同樣蛋疼的是,由於多了一層VM,端口映射也顯得比較麻煩。首先你需要設置VirtualBox的端口映射,然後再將Container的端口映射到你的VM裏面:

docker-port-map

具體是這麼做的,通過2條命令:

也就是說在docker run的時候通過-p選項指定要映射的端口到VM,而boot2docker ssh命令則是將VM的8000端口映射到了host(Mac)的8000端口,這樣你就可以通過Mac的localhost:8000訪問Container的8000端口了。 其實,有另一種解決方案就是你不用映射到host(Mac),而是直接登錄到VM裏面進行訪問就好了,boot2docker ssh就可以登錄到VM,這樣就類似於你的host是ubuntu,但這種解決方案的問題是這個ubuntu太弱了(TinyCoreLinux),如果你在這個ubuntu裏面開發代碼,或者是運行瀏覽器,是非常蛋疼的事情,關鍵還是這個ubuntu是每次重啓都會復原的!所以我建議還是做多一層映射好了。 最後,實際上在VM裏面,你是可以直接訪問所有的Container的端口的,因爲VM到Container的網絡都是橋接的。

其他的一些坑

在使用的過程中,還遇到一些不少的坑:

  1. /etc/hosts文件無法修改,這樣你就不能自己做域名解析
  2. VM的系統時間是UTC +0000的,而且貌似無法修改
  3. Container的IP無法指定爲靜態IP,因此每次重啓Container時,IP可能會變化

第1個問題的解決方案是通過安裝dnsmasq軟件來做域名解析:

第2個問題的解決方案就稍微麻煩些,起碼我沒有找到更好的解決方案,我是將boot2docker.iso文件重新制作一次來解決這個問題的:

第三個問題暫時無法解決(可能需要編輯底層的LXC配置文件)。

docker的限制以及後續的一些想法

docker其實還是有一些限制的:

  • 要求你的環境是Linux的,而且內核必須很新(>= 2.6.27 (29)),這其實是LXC本身的限制,和docker無關
  • docker的Container目前host是不能修改的,當然有解決方案(dnsmasq)
  • docker的Container也暫時無法指定靜態IP

用docker作爲開發環境甚至是生產環境其實還有很多地方值得嘗試:

  • 在團隊內部構建本地的倉庫,標準化所有的開發環境,使得團隊的新人可以快速上手
  • 在生產環境部署docker,這其實是PAAS的虛擬化和自動化的一種方式,利用LXC和Docker能夠更便捷地實施PAAS
  • 嘗試用docker做分佈式集羣模擬和測試,成本會更加低廉,更加容器維護

參考文章

  1. Linux虛擬化技術
  2. 利用Linux容器實現可移植的應用部署
  3. 如何修改host
  4. Building a Development With Docker
  5. boot2docker的build
  6. PAAS Under the Hood
發佈了14 篇原創文章 · 獲贊 8 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章