譯文:關(guān)于Docker數(shù)據(jù)容器(data only container)
什么是數(shù)據(jù)容器?
數(shù)據(jù)容器就是本身只創(chuàng)建一個(gè)volume供其他容器共享,創(chuàng)建完后即退出,不執(zhí)行任何任務(wù)。比如通過(guò)以下方式創(chuàng)建一個(gè)postgres容器。
- docker run --name dbdata postgres echo "Data-only container for postgres"
該容器運(yùn)行echo "Data-only container for postgres"即退出,然而只要沒(méi)有刪除該容器,該容器/var/lib/postgresql/data的volume(在Dockerfile使用VOLUME指令定義)就會(huì)一直存在。
然后我們可以新建若干容器來(lái)共享數(shù)據(jù),比如:
- docker run -d --volumes-from dbdata --name db1 postgres
如何創(chuàng)建數(shù)據(jù)容器?
太簡(jiǎn)單了,創(chuàng)建任何容器,然后使用-v創(chuàng)建volume即可。但大家一定會(huì)想到用最小的鏡像吧,比如hello-world,即
- docker run -v /data hello-world
但這樣是錯(cuò)誤的! 為什么呢?
我們首先創(chuàng)建一個(gè)簡(jiǎn)單的鏡像:
- FROM debian:jessie
- RUN useradd mickey
- RUN mkdir /foo && touch /foo/bar && chown -R mickey:mickey /foo
- USER mickey
- CMD ls -lh /foo
構(gòu)建:
- docker build -t mickey_foo -< Dockerfile
運(yùn)行下:
- docker run --rm -v /foo mickey_foo
輸出:
- total 0
- -rw-r--r-- 2 mickey mickey 0 Nov 18 05:58 bar
運(yùn)行正常,沒(méi)有任何問(wèn)題。
下面我們嘗試使用busybox來(lái)作為數(shù)據(jù)容器:
- docker run -v /foo --name mickey_data busybox true
- docker run --rm --volumes-from mickey_data mickey_foo
輸出:
- total 0
- # Empty WTF??
- docker run --rm --volumes-from mickey_data mickey_foo ls -lh /
- total 68K
- drwxr-xr-x 2 root root 4.0K Nov 18 06:02 bin
- drwxr-xr-x 2 root root 4.0K Oct 9 18:27 boot
- drwxr-xr-x 5 root root 360 Nov 18 06:05 dev
- drwxr-xr-x 1 root root 4.0K Nov 18 06:05 etc
- drwxr-xr-x 2 root root 4.0K Nov 18 06:02 foo
- drwxr-xr-x 2 root root 4.0K Oct 9 18:27 home
- drwxr-xr-x 9 root root 4.0K Nov 18 06:02 lib
- drwxr-xr-x 2 root root 4.0K Nov 18 06:02 lib64
- drwxr-xr-x 2 root root 4.0K Nov 5 21:40 media
- drwxr-xr-x 2 root root 4.0K Oct 9 18:27 mnt
- drwxr-xr-x 2 root root 4.0K Nov 5 21:40 opt
- dr-xr-xr-x 120 root root 0 Nov 18 06:05 proc
- drwx------ 2 root root 4.0K Nov 18 06:02 root
- drwxr-xr-x 3 root root 4.0K Nov 18 06:02 run
- drwxr-xr-x 2 root root 4.0K Nov 18 06:02 sbin
- drwxr-xr-x 2 root root 4.0K Nov 5 21:40 srv
- dr-xr-xr-x 13 root root 0 Nov 18 06:05 sys
- drwxrwxrwt 2 root root 4.0K Nov 5 21:46 tmp
- drwxr-xr-x 10 root root 4.0K Nov 18 06:02 usr
- drwxr-xr-x 11 root root 4.0K Nov 18 06:02 var
Owened by root? WTF???
- docker run --rm --volumes-from mickey_data mickey_foo touch /foo/ba
- touch: cannot touch '/foo/bar': Permission denied
發(fā)生了什么呢?我們的/foo 仍然存在, 但是它是空的并且所有者是root?
讓我們?cè)僭囋囀褂梦覀儎倓倶?gòu)建的mickey_foo作為數(shù)據(jù)容器:
- ~: docker rm -v mickey_data # remove the old one
- mickey_data
- ~: docker run --name mickey_data -v /foo mickey_foo true
- ~: docker run --rm --volumes-from mickey_data mickey_foo
- total 0
- -rw-r--r-- 1 mickey mickey 0 Nov 18 05:58 bar
- # Yes!
- ~: docker run --rm --volumes-from mickey_data mickey_foo ls -lh /
- total 68K
- drwxr-xr-x 2 root root 4.0K Nov 18 06:02 bin
- drwxr-xr-x 2 root root 4.0K Oct 9 18:27 boot
- drwxr-xr-x 5 root root 360 Nov 18 06:11 dev
- drwxr-xr-x 1 root root 4.0K Nov 18 06:11 etc
- drwxr-xr-x 2 mickey mickey 4.0K Nov 18 06:10 foo
- drwxr-xr-x 2 root root 4.0K Oct 9 18:27 home
- drwxr-xr-x 9 root root 4.0K Nov 18 06:02 lib
- drwxr-xr-x 2 root root 4.0K Nov 18 06:02 lib64
- drwxr-xr-x 2 root root 4.0K Nov 5 21:40 media
- drwxr-xr-x 2 root root 4.0K Oct 9 18:27 mnt
- drwxr-xr-x 2 root root 4.0K Nov 5 21:40 opt
- dr-xr-xr-x 121 root root 0 Nov 18 06:11 proc
- drwx------ 2 root root 4.0K Nov 18 06:02 root
- drwxr-xr-x 3 root root 4.0K Nov 18 06:02 run
- drwxr-xr-x 2 root root 4.0K Nov 18 06:02 sbin
- drwxr-xr-x 2 root root 4.0K Nov 5 21:40 srv
- dr-xr-xr-x 13 root root 0 Nov 18 06:05 sys
- drwxrwxrwt 2 root root 4.0K Nov 5 21:46 tmp
- drwxr-xr-x 10 root root 4.0K Nov 18 06:02 usr
- drwxr-xr-x 11 root root 4.0K Nov 18 06:02 var
- # YES!!
- ~: docker run --rm --volumes-from mickey_data mickey_foo touch /foo/baz
- ~: docker run --rm --volumes-from mickey_data mickey_foo ls -lh /foo
- total 0
- -rw-r--r-- 1 mickey mickey 0 Nov 18 06:11 bar
- -rw-r--r-- 1 mickey mickey 0 Nov 18 06:12 baz
- # YES!!!
由于我們剛剛使用了相同的鏡像作為數(shù)據(jù)容器鏡像,共享的容器能夠找到共享數(shù)據(jù)。為什么使用busybox不可以呢?由于busybox沒(méi)有/foo這個(gè)目錄,當(dāng)我們使用-v創(chuàng)建/foo這個(gè)數(shù)據(jù)卷時(shí),docker會(huì)以默認(rèn)用戶(hù)自動(dòng)創(chuàng)建對(duì)應(yīng)的目錄(這里是root),而--volumes-from僅僅是重用存在的卷,而不會(huì)對(duì)卷自動(dòng)做任何事情。因此當(dāng)我們嘗試去寫(xiě)/foo時(shí)由于沒(méi)有權(quán)限(root所有,mickey用戶(hù)).
因此我們應(yīng)該使用和共享的容器相同的鏡像做數(shù)據(jù)容器鏡像?是的!
那我們使用這么大的鏡像不會(huì)浪費(fèi)空間么?
為什么不使用小鏡像作為數(shù)據(jù)容器?
其中一個(gè)原因,在上一節(jié)已經(jīng)解釋。遺留的一個(gè)問(wèn)題是使用這么大的鏡像(因?yàn)橐话愕溺R像都會(huì)比較大)會(huì)不會(huì)浪費(fèi)空間呢?
首先我們需要知道Docker的文件系統(tǒng)是如何工作的。Docker鏡像是由多個(gè)文件系統(tǒng)(只讀層)疊加而成。當(dāng)我們啟動(dòng)一個(gè)容器的時(shí)候,Docker會(huì)加載只讀鏡像層并在其上(譯者注:鏡像棧頂部)添加一個(gè)讀寫(xiě)層。如果運(yùn)行中的容器修改了現(xiàn)有的一個(gè)已經(jīng)存在的文件,那該文件將會(huì)從讀寫(xiě)層下面的只讀層復(fù)制到讀寫(xiě)層,該文件的只讀版本仍然存在,只是已經(jīng)被讀寫(xiě)層中該文件的副本所隱藏。當(dāng)刪除Docker容器,并通過(guò)該鏡像重新啟動(dòng)時(shí),之前的更改將會(huì)丟失。在Docker中,只讀層及在頂部的讀寫(xiě)層的組合被稱(chēng)為Union File System(聯(lián)合文件系統(tǒng))。
因此當(dāng)我們創(chuàng)建了一個(gè)debian容器實(shí)例時(shí)(大約150MB),根據(jù)以上的原理,我們?cè)賱?chuàng)建1000個(gè)debian鏡像能夠重用原來(lái)的只讀層,需要的空間還是150MB.
容器本身并不會(huì)占任何空間,除非你修改了內(nèi)容。
因此Docker無(wú)論創(chuàng)建一個(gè)鏡像的多少實(shí)例,都不會(huì)占據(jù)更多的空間。
因此實(shí)際上,我們?yōu)榱藙?chuàng)建數(shù)據(jù)容器而使用busybox反而會(huì)占用更多的空間,這個(gè)空間就是busybox的鏡像大小。
實(shí)際上我們經(jīng)常這樣使用:
- ~: docker run --name mydb-data --entrypoint /bin/echo mysql Data-only container for mydb
- ~: docker run -d --name mydb --volumes-from mydb-data mysql
上面的實(shí)例指行/bin/echo mysql Data-only container for mydb,能夠更容易知道這是一個(gè)數(shù)據(jù)容器,利于使用grep查找.
【本文是51CTO專(zhuān)欄作者“付廣平”的原創(chuàng)文章,如需轉(zhuǎn)載請(qǐng)通過(guò)51CTO獲得聯(lián)系】


























