Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。
对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。
而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。
1 [root@localhost ~]# docker run -it --name b1 --rm busybox /bin/sh # 创建一给b1容器 2 / # ls 3 bin dev etc home proc root sys tmp usr var # 官方做的,里面的目录 4 / # mkdir data # 建一个data目录 5 / # echo 'hello world' > data/index.html # 把hello world写进去 6 / # ls 7 bin data dev etc home proc root sys tmp usr var 8 / # cat data/index.html # 查看一下 9 hello world 10 [root@localhost ~]# docker commit -a 'sun <1@2.com>' -c 'cmd ["/bin/sh"]' -p b1 busybox:v0.1 # 用b1做一个镜像 11 sha256:8d5ede800a4054da7f33303b336c87f99675a16d3906a7976d448a45a39e128b 12 REPOSITORY TAG IMAGE ID CREATED SIZE 13 busybox v0.1 8d5ede800a40 About a minute ago 1.24MB 14 busybox latest beae173ccac6 3 months ago 1.24MB 15 httpd latest dabbfbe0c57b 4 months ago 144MB 16 centos latest 5d0da3dc9764 7 months ago 231MB 17 [root@localhost ~]# docker run -it --name b2 busybox:v0.1 # 用刚刚busybox:v0.1运行一个b2的容器 18 / # ls # 查看的到之前创建的data目录 19 bin data dev etc home proc root sys tmp usr var 20 / # ls data/ # 内容也是可以看到的 21 index.html 22 / # rm -rf data # 删除它 23 / # ls # 查看虽然是没了,但是不是被删除了,是被隐藏了 24 bin dev etc home proc root sys tmp usr var
存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。
在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。
如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。
我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。
Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。
这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。
关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。
因此Docker存在的问题有:
而要解决这些问题,解决方案就是使用存储卷。
存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。
Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。
存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。
卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。
Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:
用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。
容器中管理数据主要有两种方式:
容器Volume使用语法:
Docker-managed volume(docker管理的卷)
1 [root@localhost ~]# docker run -it -rm --name b1 -v /data busybox /bin/sh # 启动容器里面创建一个data目录 2 / # ls # 有data目录会跟真机的某个目录做绑定关系 3 bin data dev etc home proc root sys tmp usr var 4 / # ls data/ # 容器data是空的 5 [root@localhost ~]# docker inspect b1 # 容器的绑定关系 6 "Mounts": [ # 挂载点 7 { 8 "Type": "volume", # 卷 9 "Name": "660df96fc15a2ff6434184b040cf0d25c47cbeef9665fa4be05b509e00c3fa59", 10 "Source": "/var/lib/docker/volumes/660df96fc15a2ff6434184b040cf0d25c47cbeef9665fa4be05b509e00c3fa59/_data", # 真机的位子 11 "Destination": "/data", # 容器的位子 12 "Driver": "local", 13 "Mode": "", 14 "RW": true, 15 "Propagation": "" 16 [root@localhost ~]# cd /var/lib/docker/volumes/660df96fc15a2ff6434184b040cf0d25c47cbeef9665fa4be05b509e00c3fa59/_data # 进来真机位子现在是空的 17 [root@localhost _data]# ls 18 [root@localhost _data]# touch abc # 真机位子加点内容 19 [root@localhost _data]# ls 20 abc 21 / # ls data/ # 然后去容器的里面看一样也有了,真机加容器也可以看到 22 abc 23 / # rm -f data/abc # 容器把内容删掉 24 [root@localhost _data]# ls # 真机上也没有了,真机上创建也可以删 25 [root@localhost _data]# touch abc # 真机在加一点内容 26 / # exit # 容器退出加了-rm所以容器就删除 27 [root@localhost _data]# ls # 容器退出所以真机上的也没有了,
Bind mount volume(绑定挂载卷)
[root@localhost ~]# docker run -it --rm --name b1 -v /web:/data/ busybox # 真机web目录绑定容器创建的data目录启动b1容器 / # ls bin data dev etc home proc root sys tmp usr var # 容器/目录下面有一个data目录 [root@localhost ~]# ls / bin boot dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var web # 真机/目录下有一个web目录,是容器自动创建的 [root@localhost ~]# cd /web/ # 都是空的 [root@localhost web]# ls [root@localhost web]# echo 'hello world' > index.html # 真机在web目录里加一个网站进去写点内容 [root@localhost web]# ls index.html [root@localhost web]# cat index.html hello world / # cd data/ # 容器里面也都有刚才加进去的内容 /data # ls index.html /data # cat index.html hello world /data # exit # 退出容器有-rm所以退出容器就被删除 [root@localhost ~]# docker ps -a # 没有容器了 CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES [root@localhost web]# ls # 真机上查看目录等文件还在 index.html [root@localhost web]# cat index.html hello world # 用这种绑定挂载卷,容器删除但是绑定的目录下的文件都还在 [root@localhost ~]# docker run -it --rm --name b1 -v /web:/data/ busybox / # ls bin data dev etc home proc root sys tmp usr var / # cd data /data # ls index.html /data # cat index.html hello world # 如果在去启动一个相同的容器,里面的东西都还在,应为data用的就是web的内容
1 [root@localhost web]# ls 2 index.html 3 [root@localhost web]# rm -f index.html # 删除真机里的网站服务 4 [root@localhost web]# mv ~/htmlxunakuhei.zip . # 把家目录的网站移过来 5 [root@localhost web]# ls 6 htmlxunakuhei.zip 7 [root@localhost web]# dnf -y install unzip # 先下一个解压的包 8 [root@localhost web]# unzip htmlxunakuhei.zip # 解压 9 [root@localhost web]# ls 10 htmlxunakuhei htmlxunakuhei.zip # 好了 11 [root@localhost web]# mv htmlxunakuhei/* . # 移到web目录 12 [root@localhost web]# ls 13 服务器之家.url 精品免费商业源码下载.url css fonts htmlxunakuhei htmlxunakuhei.zip images index.html js m 14 [root@localhost web]# rm -rf htmlxunakuhei/ htmlxunakuhei.zip # 删掉 15 [root@localhost web]# ls 16 服务器之家.url 精品免费商业源码下载.url css fonts images index.html js m # 网站内容放到web里去了 17 /data # exit # 退出容器 18 [root@localhost web]# ls 19 服务器之家.url 精品免费商业源码下载.url css fonts images index.html js m # 用web里面网站的内容新奇一个容器 20 [root@localhost ~]# docker run -d --name web -v /web:/usr/local/apache2/htdocs -p 80:80 httpd # 把真机web的内容放到htdocs里,在后台启动一个叫web的容器,暴露端口号 21 7fddee3d9bef0709b9832e9bf618c64aee1f8a289d4d1ab95c5a9774854416da 22 [root@localhost ~]# docker ps 23 CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 24 7fddee3d9bef httpd "httpd-foreground" 15 minutes ago Up 15 minutes 0.0.0.0:80->80/tcp, :::80->80/tcp web 25 [root@localhost ~]# ss -antl 26 State Recv-Q Send-Q Local Address:Port Peer Address:Port Process 27 LISTEN 0 128 0.0.0.0:80 0.0.0.0:* 28 LISTEN 0 128 0.0.0.0:22 0.0.0.0:* 29 LISTEN 0 128 [::]:80 [::]:* 30 LISTEN 0 128 [::]:22 [::]:*
在容器内创建一个数据卷
下面使用nginx镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录下:
[root@localhost ~]# docker run -d -P --name web -v /webapp nginx
这里的-P是允许外部访问容器需要暴露的端口。
挂载一个主机目录作为数据卷
[root@localhost ~]# docker run -d -P --name web1 -v /var/www/html:/webapp nginx
上面的命令加载主机的/var/www/html
目录到容器的/webapp
目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。
Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:
加了:ro以后,容器内挂载的数据卷的数据就无法修改了。
1 [root@localhost ~]# docker run -d --name web -v /web:/usr/local/apache2/htdocs:ro -p 80:80 httpd 2 0a409a4298e456f593a7ec64bb67b7a22ea060f4d36dbfb70a31ac3f57fdc2b4 # 还是可以正常访问,访问只是用读的权限 3 [root@localhost ~]# docker exec -it web /bin/bash # 进到web容器 4 root@0a409a4298e4:/usr/local/apache2# cd htdocs/ # 进到htdocs 5 root@0a409a4298e4:/usr/local/apache2/htdocs# ls # 查看内容 6 css index.html ''$'\346\234\215\345\212\241\345\231\250\344\271\213\345\256\266''.url' 7 fonts js ''$'\347\262\276\345\223\201\345\205\215\350\264\271\345\225\206\344\270\232\346\272\220\347\240\201\344\270\213\350\275\275''.url' 8 images m 9 root@0a409a4298e4:/usr/local/apache2/htdocs# touch abc # 加一点新内容 10 touch: cannot touch 'abc': Read-only file system # 报错说只能读 11 root@0a409a4298e4:/usr/local/apache2/htdocs# ls 12 css index.html ''$'\346\234\215\345\212\241\345\231\250\344\271\213\345\256\266''.url' 13 fonts js ''$'\347\262\276\345\223\201\345\205\215\350\264\271\345\225\206\344\270\232\346\272\220\347\240\201\344\270\213\350\275\275''.url' 14 images m # 还是之前的那些东西 15 [root@localhost web]# touch abc 16 [root@localhost web]# ls 17 服务器之家.url 精品免费商业源码下载.url abc css fonts images index.html js m # 但是在真机上可以改 18 root@0a409a4298e4:/usr/local/apache2/htdocs# ls 19 abc images m 20 css index.html ''$'\346\234\215\345\212\241\345\231\250\344\271\213\345\256\266''.url' 21 fonts js ''$'\347\262\276\345\223\201\345\205\215\350\264\271\345\225\206\344\270\232\346\272\220\347\240\201\344\270\213\350\275\275''.url' # 真机加了,容器里面也可以看到,只能在真机上改容器里不行,在容器里改会影响文件在硬盘存放的位子 22
挂载一个本地主机文件作为数据卷
-v选项也可以从主机挂载单个文件到容器中作为数据卷:一般不大可能用文件作为挂载卷,要么是用目录要么是把文件放到某个目录用这个目录来挂载
[root@localhost ~]# docker run -it --rm -v ~/.bash_history:/.bash_history centos /bin/bash
这样就可以记录在容器输入过的命令历史了。
如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。所以推荐的方式是直接挂载文件所在的目录。
如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:(就是一个专门放数据的容器,这个容器可以被其他的容器挂载使用)
首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata
[root@localhost ~]# docker run -it -d --name dbdata -v /dbdata centos
然后可以在其他容器中使用--volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:
[root@localhost ~]# docker run -d --name db1 --volumes-from dbdata centos [root@localhost ~]# docker run -d --name db2 --volumes-from dbdata centos
此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
例如,在db1容器中创建一个test文件:
[root@localhost ~]# docker exec -it db1 /bin/bash [root@75b50c43ce20 /]# ls bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv sys tmp usr var [root@75b50c43ce20 /]# cd dbdata/ [root@75b50c43ce20 dbdata]# touch test [root@75b50c43ce20 dbdata]# ls test
在db2容器中查看:
[root@localhost ~]# docker exec -it db2 /bin/bash [root@c0b4bb5ff5b9 /]# ls dbdata/ test
可以多次使用--volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:
[root@localhost ~]# docker run -d --name db3 --volumes-from db1 centos
使用--volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。
如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。
[root@localhost ~]# docker run -itd --name dbdata -v /dbdata busybox # 创建一个叫dbdata的数据卷容器,并在其中创建一个数据卷挂载到/dbdata目录 [root@localhost ~]# docker run -itd --name db1 --valumes-from dbdata busybox #运行一个叫db1的容器,他的数据来源于dbdata容器 [root@localhost ~]# docker run -itd --name db2 --volumes-from dbdata busybox #运行一个叫db2的容器,他的数据来源于dbdata容器 624e13b1dcee65a7e87127587a76679300a68df88e5b6e27971188a6817bf050 [root@localhost ~]# docker ps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 624e13b1dcee busybox "sh" 5 seconds ago Up 3 seconds db2 5dd060ecb868 busybox "sh" About a minute ago Up About a minute db1 9acbf92a257e busybox "sh" 7 minutes ago Up 7 minutes dbdata [root@localhost ~]# docker exec -it db1 /bin/sh # 进到db1容器 / # ls # 查看有dbdata目录 bin dbdata dev etc home proc root sys tmp usr var / # cd dbdata/ # 进到dbdata里面去 /dbdata # ls # 里面是空的 /dbdata # touch abc # 在dbdata加入abc /dbdata # ls abc [root@localhost ~]# docker exec -it db2 /bin/sh # 进到db2容器 / # ls bin dbdata dev etc home proc root sys tmp usr var / # cd dbdata # 进到dbdata目录可以看到db1写的内容 /dbdata # ls abc /dbdata # rm -rf abc # 删除内容 /dbdata # ls # 没有了 /dbdata # ls # 切换到db1容器内容也看不到了,因为他们数据是共享一个位子的 [root@localhost ~]# docker run -itd --name db3 --volumes-from db2 busybox # 运行一个db3容器,它的数据来源于db2 619b0b4630105071aebe2b5bd27d0ebc6cc233f1a76a67741a9c528fe16c5c86 [root@localhost ~]# docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 619b0b463010 busybox "sh" About a minute ago Up About a minute db3 624e13b1dcee busybox "sh" 13 minutes ago Up 13 minutes db2 5dd060ecb868 busybox "sh" 14 minutes ago Up 14 minutes db1 9acbf92a257e busybox "sh" 20 minutes ago Up 20 minutes dbdata [root@localhost ~]# docker exec -it db3 /bin/sh # 进到db3容器 / # cd dbdata # 进到dbdata目录 /dbdata # ls /dbdata # echo 'hello world' > abc # 写一点内容到abc目录 /dbdata # ls abc /dbdata # cat abc # 查看 hello world [root@localhost ~]# docker exec -it dbdata /bin/sh # 进到dbdata容器 / # cd dbdata #进到dbdata目录 /dbdata # ls # 也能看到db3容器写的内容 abc /dbdata # cat abc hello world [root@localhost ~]# docker stop dbdata # 停掉dbdata容器 dbdata /dbdata # ls #切换到db3容器,一样也可以看到里面的内容, abc /dbdata # cat abc hello world [root@localhost ~]# docker exec -it db2 /bin/sh # 在进到db2 / # cd dbdata #进到dbdata目录创建一个hehe目录 /dbdata # mkdir hehe /dbdata # ls abc hehe /dbdata # ls #切换到db1容器一样可以看到 abc hehe # 说明dbdata只是提供一个共享的场所,不需要运行起来 [root@localhost ~]# docker rm -f dbdata # 删除dbdata容器 dbdata [root@localhost ~]# docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 619b0b463010 busybox "sh" 20 minutes ago Up 20 minutes db3 624e13b1dcee busybox "sh" 32 minutes ago Up 32 minutes db2 5dd060ecb868 busybox "sh" 33 minutes ago Up 33 minutes db1 /dbdata # mkdir 123 # 切换到db3容器在创建一个123目录 /dbdata # ls 123 abc hehe /dbdata # ls # 切换到db1容器一样可以看到,说明只要共享关系绑定,初始的容器删除不需要,也可以 123 abc hehe [root@localhost ~]# docker inspect db1 # 查看真机存放数据的位子 /var/lib/docker/volumes/72c2f583d6d7237bf5373f7d6c1780b2111fdc01c66bf511d63cfc68116e4d21/_data [root@localhost ~]# docker rm -f db1 db2 db3 # 删除这3个容器 db1 db2 db3 [root@localhost ~]# docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES [root@localhost ~]# cd # 进到真机存放文件的位子,东西都还在 /var/lib/docker/volumes/72c2f583d6d7237bf5373f7d6c1780b2111fdc01c66bf511d63cfc68116e4d21/_data [root@localhost _data]# ls 123 abc hehe # 如果想解除绑定关系,你删除容器的时候就要加-v选项
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
备份
使用下面的命令来备份dbdata数据卷容器内的数据卷(其实我们可以执行docker cp把它拷出来,实行备份数据的功能)
[root@localhost _data]# docker run --name worker --volumes-from dbdata -v $(pwd):/backup centos tar cvf /backup/backup.tar /dbdata # 运行一个叫worker的容器,它的卷数据来源dbdata,把当前目录跟容器backuo绑定关系,用centos镜像启动,创建压缩文件放到backuo目录里去,名字叫backup.tar,备份dbdata目录到当前文件。。。晕了,其实就是把容器里面的dbdata目录压缩一个数据包放到你本机的当前目录。
这个命令稍微有点复杂,具体分析下。
首先利用centos镜像创建了一个容器worker。使用--volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。
恢复
如果要恢复数据到一个容器,可以按照下面的操作。首先创建一个带有数据卷的容器dbdata2:
[root@localhost ~]# docker run -it --name dbdata2 -v /dbdata centos /bin/bash
然后创建另一个新的容器,挂载dbdata2容器,并使用untar解压备份文件到所挂载的容器卷中即可:
[root@localhost ~]# docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar