給一個正在運行的Docker容器動態添加Volume

之前有人問我Docker容器啓動之後還能否再掛載卷,考慮到mnt命名空間的工作原理,我一開始認爲這很難實現。不過現在Petazzoni通過使用nsenter和綁定掛載實現了這個需求,你可以在你的環境中測試下。

之前有人問我Docker容器啓動之後還能否再掛載卷,考慮mnt命名空間的工作原理,我一開始認爲這很難實現。不過現在我認爲是它實現的。

簡單來說,要想將磁盤卷掛載到正在運行的容器上,我們需要:

  • 使用nsenter將包含這個磁盤卷的整個文件系統mount到臨時掛載點上;

  • 從我們想當作磁盤卷使用的特定文件夾中創建綁定掛載(bind mount)到這個磁盤卷的位置;

  • umount第一步創建的臨時掛載點。


注意事項

在下面的示例中,我故意包含了$符號來表示這是Shell命令行提示符,以幫助大家區分哪些是你需要輸入的,哪些是機器回覆的。有一些多行命令,我也繼續用>。我知道這樣使得例子裏的命令無法輕易得被拷貝粘貼。如果你想要拷貝粘貼代碼,請查看文章最後的示例腳本。

詳細步驟

下面示例的前提是你已經使用如下命令啓動了一個簡單的名爲charlie的容器:

$ docker run --name charlie -ti ubuntu bash


我們需要做的是將宿主文件夾/home/jpetazzo/Work/DOCKER/docker掛載到容器裏的/src目錄。好了,讓我們開始吧。

nsenter

首先,我們需要nsenter以及 docker-enter幫助腳本。爲什麼?因爲我們要從容器中mount文件系統。由於安全性的考慮,容器不允許我們這麼做。使用nsenter,我們可以突破上述安全限制,在容器的上下文(嚴格地說,是命名空間)中運行任意命令。當然,這必須要求擁有Docker宿主機的root權限。
nsenter最簡單的安裝方式是和docker-enter腳本關聯執行:

$ docker run --rm -v /usr/local/bin:/target jpetazzo/nsenter


更多細節,請查看nsenter項目主頁。

找到文件系統

我們想要在容器裏掛載包含宿主文件夾(/home/jpetazzo/Work/DOCKER/docker)的文件系統。那我們就需要找出哪個文件系統包含這個目錄。

首先,我們需要canonicalize(或者解除引用)文件,以防這是一個符號鏈接,或者它的路徑包含符號鏈接:

$ readlink --canonicalize /home/jpetazzo/Work/DOCKER/docker
/home/jpetazzo/go/src/github.com/docker/docker


哈,這的確是一個符號鏈接!讓我們將其放入一個環境變量中:

$ HOSTPATH=/home/jpetazzo/Work/DOCKER/docker
$ REALPATH=$(readlink --canonicalize $HOSTPATH)


接下來,我們需要找出哪個文件系統包含這個路徑。我們使用一個有點讓人意想不到的工具來做,它就是df:

$ df $REALPATH
Filesystem     1K-blocks      Used Available Use% Mounted on
/sda2          245115308 156692700  86157700  65% /home/jpetazzo


使用-P參數(強制使用POSIX格式,以防是exotic df,或者是其他人在Solaris或者BSD系統上裝Docker時運行的df),將結果也放到一個變量裏:

$ FILESYS=$(df -P $REALPATH | tail -n 1 | awk '{print $6}')


找到文件系統的設備(和sub-root)

現在,系統裏已經沒有綁定掛載(bind mounts)和BTRFS子捲了,我們僅僅需要查看/proc/mounts,找到對應於/home/jpetazzo文件系統的設備就可以了。但是在我的系統裏,/home/jpetazzo是BTRFS池的子卷,要想得到子卷的信息(或者bind mount信息),需要查看/proc/self/moutinfo。

如果你從來沒有聽說過mountinfo,可以查看內核文檔的proc.txt

首先,得到文件系統設備信息:

$ while read DEV MOUNT JUNK
> do [ $MOUNT = $FILESYS ] && break
> done </proc/mounts
$ echo $DEV
/dev/sda2


接下來,得到sub-root信息(比如,已掛載文件系統的路徑):

$ while read A B C SUBROOT MOUNT JUNK
> do [ $MOUNT = $FILESYS ] && break
> done < /proc/self/mountinfo 
$ echo $SUBROOT
/jpetazzo


很好。現在我們知道需要掛載/dev/sda2。在文件系統內部,進入/jpetazzo,從這裏可以得到到所需文件的剩餘路徑(示例中是/go/src/github.com/docker/docker)。
讓我們計算出剩餘路徑:

$ SUBPATH=$(echo $REALPATH | sed s,^$FILESYS,,)


注意:這個方法只適用於路徑裏沒有符號“,”的。如果你的路徑裏有“,”並且想使用本文方法掛載目錄,請告訴我。(我需要調用Shell Triad來解決這個問題:jessiesoulshaketianon?)

在進入容器之前最後需要做的是找到這個塊設備的主和次設備號。可以使用stat:

$ stat --format "%t %T" $DEV
8 2


注意這兩個數字是十六進制的,我們之後需要的是二進制。可以這麼轉換:

$ DEVDEC=$(printf "%d %d" $(stat --format "0x%t 0x%T" $DEV))


總結

還有最後一步。因爲某些我無法解釋的原因,一些文件系統(包括BTRFS)在掛載多次之後會更新/proc/mounts裏面的設備字段。也就是說,如果我們在容器裏創建了名爲/tmpblkdev的臨時塊設備,並用其掛載我們自己的文件系統,那麼文件系統(在宿主機器裏!)會顯示爲/tmpblkdev,而不是/dev/sda2。這聽起來無所謂,但實際上這會讓之後試圖得到文件系統塊設備的操作都失敗。

長話短說,我們想要確保塊設備節點在容器裏位於和宿主機器上的同一個路徑下。

需要這麼做:

$ docker-enter charlie -- sh -c \
> "[ -b $DEV ] || mknod --mode 0600 $DEV b $DEVDEC"


創建臨時掛載點掛載文件系統:

$ docker-enter charlie -- mkdir /tmpmnt
$ docker-enter charlie -- mount $DEV /tmpmnt


確保卷掛載點存在,bind mount卷:

$ docker-enter charlie -- mkdir -p /src
$ docker-enter charlie -- mount -o bind /tmpmnt/$SUBROOT/$SUBPATH /src


刪除臨時掛載點:

$ docker-enter charlie -- umount /tmpmnt
$ docker-enter charlie -- rmdir /tmpmnt


(我們並不清除設備節點。一開始就檢查設備是否存在可能有點多餘,但是現在再檢查就已經很複雜了。)

大功告成!

讓一切自動化

下面這段可以直接拷貝粘貼了。

#!/bin/sh
set -e
CONTAINER=charlie
HOSTPATH=/home/jpetazzo/Work/DOCKER/docker
CONTPATH=/src

REALPATH=$(readlink --canonicalize $HOSTPATH)
FILESYS=$(df -P $REALPATH | tail -n 1 | awk '{print $6}')

while read DEV MOUNT JUNK
do [ $MOUNT = $FILESYS ] && break 
done  </proc/mounts
[ $MOUNT = $FILESYS ] # Sanity check!

\while read A B C SUBROOT MOUNT JUNK
\do [ $MOUNT = $FILESYS ] && break
\done < /proc/self/mountinfo 
[ $MOUNT = $FILESYS ] # Moar sanity check!

SUBPATH=$(echo $REALPATH | sed s,^$FILESYS,,)
DEVDEC=$(printf "%d %d" $(stat --format "0x%t 0x%T" $DEV))

docker-enter $CONTAINER -- sh -c \
     "[ -b $DEV ] || mknod --mode 0600 $DEV b $DEVDEC"
docker-enter $CONTAINER -- mkdir /tmpmnt
docker-enter $CONTAINER -- mount $DEV /tmpmnt
docker-enter $CONTAINER -- mkdir -p $CONTPATH
docker-enter $CONTAINER -- mount -o bind /tmpmnt/$SUBROOT/$SUBPATH $CONTPATH
docker-enter $CONTAINER -- umount /tmpmnt
docker-enter $CONTAINER -- rmdir /tmpmnt


狀態和限制

上述方法不適用於不基於塊設備的文件系統,只有在/proc/mounts能正確得到塊設備節點(上面談到,並不總是能正確得到)的時候才能起作用。另外,我只測試了我自己的環境,沒有在雲實例之類的環境裏測試過,但是我很想知道在那裏是否適用。

原文鏈接:Attach a volume to a container while it is running (翻譯:崔婧雯 校對:李穎傑)

===========================
譯者介紹
崔婧雯,現就職於VMware,高級軟件工程師,負責桌面虛擬化產品的質量保證工作。曾在IBM WebSphere業務流程管理軟件擔任多年系統測試工作。對虛擬化,中間件技術有濃厚的興趣。

來自:http://dockerone.com/article/149


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章