Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(CoW)”机制。
对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。
而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。
存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。
在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。
如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。
我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。
Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。
这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。
关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。
因此Docker存在的问题有:
而要解决这些问题,解决方案就是使用存储卷。
存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。
Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。
存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。
卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。
Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:
绑定挂载卷
docker管理的卷
用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。
容器中管理数据主要有两种方式:
容器Volume使用语法:
docker管理的卷
这种方式创建的容器删除后容器内的数据将消失
[root@localhost ~]# docker run -it --name b1 --rm -v /data busybox # --rm(退出就删除容器) / # ls bin data dev etc home proc root sys tmp usr var # 新开一个终端查看此容器的信息 [root@localhost ~]# docker inspect b1 [ ………………………………………………………………………… "Name": "overlay2" }, "Mounts": [ { "Type": "volume", "Name": "49dc49e220a39352529ed865ef8ff11ecf6c655c9b6c33389f42b004363fc505", "Source": "/var/lib/docker/volumes/49dc49e220a39352529ed865ef8ff11ecf6c655c9b6c33389f42b004363fc505/_data", # 在这个目录下 "Destination": "/data", "Driver": "local", "Mode": "", "RW": true, "Propagation": "" } ] [root@localhost ~]# cd /var/lib/docker/volumes/49dc49e220a39352529ed865ef8ff11ecf6c655c9b6c33389f42b004363fc505/ [root@localhost 49dc49e220a39352529ed865ef8ff11ecf6c655c9b6c33389f42b004363fc505]# ls _data # 回到创建容器的终端 / # ls data/ / # touch data/avc / # ls data/ avc # 回到查看容器信息的终端查看 [root@localhost 49dc49e220a39352529ed865ef8ff11ecf6c655c9b6c33389f42b004363fc505]# ls _data/ avc # 删除容器后数据就消失 / # exit # 回到查看容器信息的终端查看 [root@localhost 49dc49e220a39352529ed865ef8ff11ecf6c655c9b6c33389f42b004363fc505]# ls # 数据消失
挂载绑定的卷
这种方式创建的容器在删除容器后数据依旧存在
# 在一个终端创建容器 [root@localhost ~]# ls /opt/ [root@localhost ~]# docker run -it --name b2 --rm -v /opt/data:/data busybox / # ls bin data dev etc home proc root sys tmp usr var / # ls data/ # 使用另一个终端查看 [root@localhost ~]# ls /opt/ containerd data # 回到创建容器的终端 / # touch data/ab / # echo "hello!" > data/ab / # cat data/ab hello! # 再使用另一个终端查看 [root@localhost ~]# ls /opt/data/ ab [root@localhost ~]# cat /opt/data/ab hello! # 回到创建容器的终端 /# exit # 退出容器 [root@localhost ~]# docker ps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES # 再使用另一个终端查看数据是否存在 [root@localhost ~]# cat /opt/data/ab hello!
在容器内创建一个数据卷
下面使用centos镜像创建一个httpd容器,并创建一个数据卷挂载到容器的相应目录下:
[root@localhost ~]# docker images REPOSITORY TAG IMAGE ID CREATED SIZE busybox latest d23834f29b38 6 days ago 1.24MB centos latest 5d0da3dc9764 2 months ago 231MB [root@localhost ~]# docker run -it --name httpd centos /bin/bash /# # 新开一个终端将包上传到httpd容器中 [root@localhost ~]# docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES af0cbeef25d7 centos "/bin/bash" 5 minutes ago Up 5 minutes httpd [root@localhost ~]# cd /usr/src/ [root@localhost src]# ls apr-1.7.0.tar.gz apr-util-1.6.1.tar.gz debug httpd-2.4.48.tar.gz js11531.zip kernels [root@localhost src]# docker cp httpd-2.4.48.tar.gz httpd:/usr/src/ [root@localhost src]# docker cp apr-1.7.0.tar.gz httpd:/usr/src/ [root@localhost src]# docker cp apr-util-1.6.1.tar.gz httpd:/usr/src/ # 回到httpd容器查看 [root@af0cbeef25d7 /]# ls /usr/src/ apr-1.7.0.tar.gz apr-util-1.6.1.tar.gz debug httpd-2.4.48.tar.gz kernels # 下载工具包 [root@af0cbeef25d7 /]# yum group mark install 'Development Tools' # 创建用户 [root@af0cbeef25d7 /]# useradd -r -M -s /sbin/nologin httpd [root@af0cbeef25d7 /]# id httpd uid=998(httpd) gid=996(httpd) groups=996(httpd) # 安装依赖包 [root@af0cbeef25d7 /]# yum -y install openssl-devel pcre-devel expat-devel libtool gcc gcc-c++ make wget vim net-tools which # 解压 root@af0cbeef25d7 /]# cd /usr/src/ [root@af0cbeef25d7 src]# ls apr-1.7.0.tar.gz apr-util-1.6.1.tar.gz debug httpd-2.4.48.tar.gz kernels [root@af0cbeef25d7 src]# tar xf apr-1.7.0.tar.gz [root@af0cbeef25d7 src]# tar xf apr-util-1.6.1.tar.gz [root@af0cbeef25d7 src]# tar xf httpd-2.4.48.tar.gz [root@af0cbeef25d7 src]# ls apr-1.7.0 apr-util-1.6.1 debug httpd-2.4.48.tar.gz apr-1.7.0.tar.gz apr-util-1.6.1.tar.gz httpd-2.4.48 kernels # 进到apr目录编译 [root@af0cbeef25d7 src]# cd apr-1.7.0 [root@af0cbeef25d7 apr-1.7.0]# vi configure ..... 31878 cfgfile=${ofile}T 31879 trap "$RM \"$cfgfile\"; exit 1" 1 2 15 31880 # $RM "$cfgfile" # 删除或注释掉 31881 31882 cat <<_LT_EOF >> "$cfgfile" ...... # 编译安装apr [root@af0cbeef25d7 apr-1.7.0]# ./configure --prefix=/usr/local/apr ...... [root@af0cbeef25d7 apr-1.7.0]# make && make install ...... # 进到apr-util目录编译 [root@af0cbeef25d7 apr-1.7.0]# cd ../apr-util-1.6.1 [root@af0cbeef25d7 apr-util-1.6.1]# ./configure --prefix=/usr/local/apr-util --with-apr=/usr/local/apr ...... [root@af0cbeef25d7 apr-util-1.6.1]# make && make install # 进到httpd目录编译 [root@af0cbeef25d7 httpd-2.4.48]# ./configure --prefix=/usr/local/apache \ --enable-so \ --enable-ssl \ --enable-cgi \ --enable-rewrite \ --with-zlib \ --with-pcre \ --with-apr=/usr/local/apr \ --with-apr-util=/usr/local/apr-util/ \ --enable-modules=most \ --enable-mpms-shared=all \ --with-mpm=prefork ........ [root@af0cbeef25d7 httpd-2.4.48]# make && make install ........ # 访问测试 [root@af0cbeef25d7 httpd-2.4.48]# cd [root@af0cbeef25d7 ~]# ss -antl State Recv-Q Send-Q Local Address:Port Peer Address:Port Process [root@af0cbeef25d7 ~]# /usr/local/apache/bin/apachectl start AH00558: httpd: Could not reliably determine the server's fully qualified domain name, using 192.168.2.2. Set the 'ServerName' directive globally to suppress this message [root@af0cbeef25d7 ~]# ss -antl State Recv-Q Send-Q Local Address:Port Peer Address:Port Process LISTEN 0 128 0.0.0.0:80 0.0.0.0:* [root@af0cbeef25d7 ~]# curl 192.168.2.2 <html><body><h1>It works!</h1></body></html> # 写脚本让其在前台运行 [root@af0cbeef25d7 /]# cat start.sh #!/bin/bash /usr/local/apache/bin/apachectl -D FOREGROUND [root@af0cbeef25d7 /]# chmod +x start.sh [root@af0cbeef25d7 /]# ls --color=auto bin etc lib lost+found mnt proc run srv sys usr dev home lib64 media opt root sbin start.sh tmp var # 打开新的终端将其做成镜像 [root@localhost ~]# docker commit -c 'CMD ["/start.sh"]' httpd yunjisuanlp/httpd:v1 sha256:bfdb3a439fd266368c8e8a7eac77039bed05cff0ebce9318b32d9826b4090de8 [root@localhost ~]# docker images REPOSITORY TAG IMAGE ID CREATED SIZE yunjisuanlp/httpd v1 bfdb3a439fd2 7 seconds ago 740MB # 新生成的镜像 yunjisuanlp/php8 v3 b909efd581d2 2 days ago 1.52GB yunjisuanlp/nginx v3 2d602879e8ab 2 days ago 550MB yunjisuanlp/mysql v1 77281e1fab7e 2 days ago 3.78GB busybox latest d23834f29b38 6 days ago 1.24MB centos latest 5d0da3dc9764 2 months ago 231MB # 创建映射目录 [root@localhost ~]# mkdir -p /var/www/html # 将从源码之家下载的文件放入其中 [root@localhost html]# ls '#U514d#U8d39#U7d20#U6750#U4e0b#U8f7d.url' img '#U5546#U4e1a#U6e90#U7801#U514d#U8d39#U4e0b#U8f7d.url' index.html '#U7ec7#U68a6#U6a21#U677f#U514d#U8d39#U4e0b#U8f7d.url' js '#U8bf4#U660e.htm' js11531.zip css # 将宿主机的/var/www/html目录映射到http容器中的/usr/local/apache/htdocs目录中 # 挂载一个主机目录作为数据卷 [root@localhost html]# docker run -d -p 80:80 --name web -v /var/www/html:/usr/local/apache/htdocs/ yunjisuanlp/httpd:v1 5213752cb4feed240fa8fc74b463b072038e8734bb9d7f0a5174abaa01e25c04 # 上面的命令加载主机的/var/www/html目录到容器的指定目录: # 这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是# 绝对路径,如果目录不存在,Docker会自动创建。 # Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读: docker run -d -p 80:80 --name web -v /var/www/html:/usr/local/apache/htdocs/:ro yunjisuanlp/httpd:v1 # 加了:ro以后,容器内挂载的数据卷的数据就无法修改了。 [root@localhost html]# docker exec -it web /bin/bash [root@c3ba26f40f28 ]# cd /usr/local/apache/htdocs/ [root@c3ba26f40f28 htdocs]# ls abc index.html '#U514d#U8d39#U7d20#U6750#U4e0b#U8f7d.url' '#U8bf4#U660e.htm' css js '#U5546#U4e1a#U6e90#U7801#U514d#U8d39#U4e0b#U8f7d.url' img js11531.zip '#U7ec7#U68a6#U6a21#U677f#U514d#U8d39#U4e0b#U8f7d.url' [root@c3ba26f40f28 htdocs]# touch ll # 再创建文件就拒绝 touch: cannot touch 'll': Read-only file system (只读文件系统) # 用另一个终端查看 [root@localhost html]# docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 5213752cb4fe yunjisuanlp/httpd:v1 "/start.sh" 11 minutes ago Up 11 minutes 0.0.0.0:80->80/tcp, :::80->80/tcp web [root@localhost html]# ss -antl State Recv-Q Send-Q Local Address:Port Peer Address:Port Process LISTEN 0 128 0.0.0.0:80 0.0.0.0:* LISTEN 0 128 0.0.0.0:22 0.0.0.0:* # 查看宿主机IP [root@localhost html]# ip a 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever preferred_lft forever inet6 ::1/128 scope host valid_lft forever preferred_lft forever 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq_codel state UP group default qlen 1000 link/ether 00:0c:29:21:52:e8 brd ff:ff:ff:ff:ff:ff inet 192.168.220.17/24 brd 192.168.220.255 scope global noprefixroute ens33 # 宿主机IP valid_lft forever preferred_lft forever inet6 fe80::1792:21f6:7f28:5ffa/64 scope link noprefixroute valid_lft forever preferred_lft forever 3: docker0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UP group default link/ether 02:42:6e:55:e9:3f brd ff:ff:ff:ff:ff:ff inet 192.168.2.1/24 brd 192.168.2.255 scope global docker0 ...............
浏览器访问此IP
如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:
首先,创建一个数据卷容器b1,并在其中创建一个数据卷挂载到/dbdata:
[root@localhost ~]# docker run -d -p 80 --name b1 -v /dbdata yunjisuanlp/httpd:v1 c92f645317a286ebd1eed5c89992bb779ee08e599eae4e4af36f00eeef4f5457 [root@localhost ~]# docker exec -it b1 /bin/bash [root@c92f645317a2 /]# ls --color=auto bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv start.sh sys tmp usr var [root@c92f645317a2 /]# cd dbdata/ [root@c92f645317a2 dbdata]# ls [root@c92f645317a2 dbdata]# mkdir html [root@c92f645317a2 dbdata]# mkdir conf [root@c92f645317a2 dbdata]# cp /usr/local/apache/conf/httpd.conf conf/ [root@c92f645317a2 dbdata]# cp /usr/local/apache/htdocs/index.html html/ [root@c92f645317a2 dbdata]# ls --color=auto conf html [root@c92f645317a2 dbdata]# ls conf/ --color=auto httpd.conf [root@c92f645317a2 dbdata]# ls html/ --color=auto index.html
然后可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷,例如创建b2和b3两个容器,并从b1容器挂载数据卷:
# 创建容器b2,并从b1容器挂载数据卷 [root@localhost ~]# docker run -d --name b2 -p 80 --volumes-from b1 yunjisuanlp/httpd:v1 8dac84832f42affc0cf8998604c922e2cde65b62893023bcb2336e037f268c3a [root@localhost ~]# docker exec -it b2 /bin/bash [root@8dac84832f42 /]# ls bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv start.sh sys tmp usr var [root@8dac84832f42 /]# ls dbdata/ --color=auto # 查看是否从b1容器挂载的内容 conf html [root@8dac84832f42 /]# rm -f /usr/local/apache/conf/httpd.conf # 删除此容器原本的配置文件 [root@8dac84832f42 /]# ln -sv /dbdata/conf/httpd.conf /usr/local/apache/conf/httpd.conf #链接b1挂载数据卷的文件 '/usr/local/apache/conf/httpd.conf' -> 'dbdata/conf/httpd.conf' [root@8dac84832f42 /]# ls -l /usr/local/apache/conf/ --color=auto total 76 drwxr-xr-x 2 root root 313 Dec 6 08:14 extra lrwxrwxrwx 1 root root 22 Dec 6 12:53 httpd.conf -> dbdata/conf/httpd.conf -rw-r--r-- 1 root root 13064 Dec 6 07:26 magic -rw-r--r-- 1 root root 60847 Dec 6 07:26 mime.types drwxr-xr-x 3 root root 37 Dec 6 07:26 original [root@8dac84832f42 /]# rm -f /usr/local/apache/htdocs/index.html # 删除此容器原本的网页文件 [root@8dac84832f42 ~]# ln -sv /dbdata/html/index.html /usr/local/apache/htdocs/index.html #链接b1挂载数据卷的文件 '/usr/local/apache/htdocs/index.html' -> '/dbdata/html/index.html' [root@8dac84832f42 ~]# cd /usr/local/apache/htdocs/ [root@8dac84832f42 htdocs]# ls -l total 0 lrwxrwxrwx 1 root root 23 Dec 6 13:03 index.html -> /dbdata/html/index.html [root@8dac84832f42 htdocs]# cat index.html <html><body><h1>It works!</h1></body></html> [root@8dac84832f42 htdocs]# exit [root@localhost ~]# docker restart b2 # 创建容器b3,并从b1容器挂载数据卷 [root@localhost ~]# docker run -d --name b3 -p 80 --volumes-from b1 yunjisuanlp/httpd:v1 9f2d941dc324207998308adea2e7f2be04c1803acad5e55caf8822d9cc8d0826 [root@localhost ~]# docker exec -it b3 /bin/bash [root@9f2d941dc324 /]# ls --color=auto bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv start.sh sys tmp usr var [root@9f2d941dc324 /]# ls dbdata/ --color=auto # 查看是否从b1容器挂载的内容 conf html [root@9f2d941dc324 /]# rm /usr/local/apache/htdocs/index.html # 删除此容器原本的网页文件 rm: remove regular file '/usr/local/apache/htdocs/index.html'? y [root@9f2d941dc324 /]# rm /usr/local/apache/conf/httpd.conf # 删除此容器原本的配置文件 rm: remove regular file '/usr/local/apache/conf/httpd.conf'? y [root@9f2d941dc324 /]# ln -sv /dbdata/conf/httpd.conf /usr/local/apache/conf/httpd.conf #链接b1挂载数据卷的文件 '/usr/local/apache/conf/httpd.conf' -> '/dbdata/conf/httpd.conf' [root@9f2d941dc324 /]# ls -l /usr/local/apache/conf/httpd.conf lrwxrwxrwx 1 root root 23 Dec 6 13:08 /usr/local/apache/conf/httpd.conf -> /dbdata/conf/httpd.conf [root@9f2d941dc324 /]# ln -sv /dbdata/conf/httpd.conf /usr/local/apache/htdocs/index.html #链接b1挂载数据卷的文件 '/usr/local/apache/htdocs/index.html' -> '/dbdata/conf/httpd.conf' [root@9f2d941dc324 /]# ls -l /usr/local/apache/htdocs/ total 0 lrwxrwxrwx 1 root root 23 Dec 6 13:08 index.html -> /dbdata/conf/httpd.conf [root@9f2d941dc324 /]# exit [root@localhost ~]# docker restart b3
此时,容器b2和b3都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
[root@localhost ~]# docker exec -it b1 /bin/bash [root@c92f645317a2 /]# ls bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv start.sh sys tmp usr var [root@c92f645317a2 /]# touch dbdata/abc [root@c92f645317a2 /]# exit exit [root@localhost ~]# docker exec -it b2 /bin/bash [root@8dac84832f42 /]# ls /dbdata/ abc conf html [root@8dac84832f42 /]# exit exit [root@localhost ~]# docker exec -it b3 /bin/bash [root@9f2d941dc324 /]# ls dbdata/ abc conf html
可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:
[root@localhost ~]# docker run -d --name b4 --volumes-from b3 yunjisuanlp/httpd:v1 # 创建新的容器b4使用已挂载了容器卷的容器b3来继续挂载数据卷
使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。
如果删除了挂载的容器(包括b1、b2和b3),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。