数据卷是一个可以供一个或多个容器使用的特殊目录。
可以达到以下目的:
1. 绕过“拷贝写”系统,以达到本地磁盘IO的性能,(比如运行一个容器,在容器中对数据卷修改内容,会直接改变宿主机上的数据卷中的内容,所以是本地磁盘IO的性能,而不是先在容器中写一份,最后还要将容器中的修改的内容拷贝出来进行同步。)
2. 绕过“拷贝写”系统,有些文件不需要在docker commit打包进镜像文件。
3. 在多个容器间共享目录
4. 在宿主和容器间共享目录
5. 在宿主和容器间共享一个文件。
创建数据卷
- 方法一:dockerfile中指定VOLUME后的目录,如
VOLUME /var/lib/test
- 方法二:docker run 命令中加-v选项。如
docker run -d -P -v /webapp training/webapp python app.py
注意这里定义的/webapp数据卷,但是不知道宿主机上与之对应的在哪里。我们需要仔细的观察docker inspectdocker ps -q
的结果,是非常长的一段东西。在这里我只摘出我们需要的部分(过后会找一段时间去查一些关于这个的每个字段的含义。)
“Mounts”: [
{
“Name”: “7dd5c8e5f0dc6f5cd215419a7f5f501b699915cd5e6c2d52c2ecaf1710d1021b”,
“Source”: “/var/lib/docker/volumes/7dd5c8e5f0dc6f5cd215419a7f5f501b699915cd5e6c2d52c2ecaf1710d1021b/_data”,
“Destination”: “/webapp”,
“Driver”: “local”,
“Mode”: “”,
“RW”: true,
“Propagation”: “”
}
],
和
“Volumes”: {
“/webapp”: {}
},
注意这里 “Name”: “7dd5c8e5f0dc6f5cd215419a7f5f501b699915cd5e6c2d52c2ecaf1710d1021b”,这个并不是容器id而是数据卷的ID,我们可以在/var/lib/docker/volumes/下找到名子为这个数字的目录。它就是我们数据卷在宿主机上对应的目录。
当然我们也可以直接挂载宿主机上的目录。给一个例子
[root@VM_116_112_centos /]# docker run -d -P -v .:/webapp training/webapp Python app.py
docker: Error response from daemon: create .: “.” includes invalid characters for a local volume name, only “[a-zA-Z0-9][a-zA-Z0-9_.-]” are allowed.
See ‘docker run –help’.
从给出错误输出我们可以看出,要挂载宿主机上的目录作为数据卷,需要用绝对路径,
[root@VM_116_112_centos gitDockerfile]# ls
abc.txt Dockerfile learnNamespaces README.md webapp
[root@VM_116_112_centos gitDockerfile]# docker run -d -P -v pwd
:/webapp training/webapp python app.py
868fcec268d6d351e23168ffd6b3ea621bbcad0bc06cff28e26cbe00e06e3c7f
挂载主机文件作为数据卷
docker run --rm -it -v 绝对路径 镜像名 执行的指令
docker run --rm -it -v ~/gitDockerfile/abc.txt:/abc.txt ubuntu:14.04 /bin/bash
~/gitDockerfile/abc.txt:/abc.txt这里需要注意一下格式,如果不这样写的话,被挂载的还是目录。
数据卷容器
专门用于挂载数据卷的容器,供其他容器引用,多用于多个容器需要共享同一段数据。用法:–volumes-from。
具体是先创建一个数据卷容器,在创建一个新的容器来引用数据卷容器。 docker run -d -v /dbdata --name=dbdata training/postgres
//创建一个数据卷容器 docker run -d --volumes-from dbdata --name=db1 training/postgres
//创建一个名为db1的容器并引用dbdata容器
可以用docker inspect 容器 | grep “Source”查看容器的数据卷
docker inspect db1 | grep “Source”
“Source”: “/var/lib/docker/volumes/f9a4a92e2fda5c20fc07759737ea00293723f537d9fad80d11c4bad7621f575e/_data”,
docker inspect dbdata | grep “Source”
“Source”: “/var/lib/docker/volumes/f9a4a92e2fda5c20fc07759737ea00293723f537d9fad80d11c4bad7621f575e/_data”,
可见这两个容器共享一个数据卷
数据的备份与恢复
这其实是利用tar命令来执行的。
备份的原理:创建一个数据卷容器,在创建一个引用数据卷容器的新容器,并设置数据卷为本地下的某个目录,并用tar -cvf 命令对数据卷目录进行打压缩。
给一个具体的例子
//创建一个数据卷容器 docker run -d -v /dbdata --name dbdata training/postgres
//创建一个新的容器并引用数据卷容器并备份新的容器 docker run -d --volumes-from dbdata --name db1 -v ~/gitDockergit/backup:/backup ubuntu tar cvf /backup/backup.tar /dbdata
这里来解释一下,以后台的形式运行一个名为db1的容器,它是引用数据卷dbdata的,所以在根下会有个dbdata目录与dbdata容器共享数据卷,而新的db1容器也关联了一个本地的数据卷,所以根下也会有一个backup目录,这里注意关联的必须是绝对路径
~/gitDockergit/backup:/backup这里用一个冒号分割,冒号前的是本地的数据卷位置,是某个目录具体到那个目录,是文件具体到那个文件,冒号后是容器中根下的路径,比如 ~/gitDockergit/backup:/test/backup,那么容器中根下的test目录下有backup目录,这个才是我们的数据卷。
运行完该命令后,我们会发现本地下多处一个backup.tar备份文件。
恢复文件原理:将本地的备份压缩包解压后加载到某个容器中,让其基于备份数据运行。
//创建一个需要恢复数据的容器 docker run -d -v /dbdata --name dbdata2 ubuntu /bin/bash -c "for((i=1;i<100;i++)); do echo 'hello'; sleep 1; done"
//恢复数据 docker run --volumes-from data2 --name db4 -v
pwd/backup:/backup busybox tar xvf /backup/backup.tar /dbdata