在生产环境中使用docker,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及到容器的数据管理操作。
容器中的管理数据主要有两种方式:
- 数据卷:容器内数据映射到本地主机环境
- 数据卷容器:使用特定容器维护数据卷
1.1.数据卷
数据卷是一个可供容器使用的特殊目录,类似于linux中的tomcat行为。
数据卷的特性:
- 数据卷可以在容器之间共享和重用,容器间传递数据将变得高效与方便
- 对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作
- 对数据卷的更新不会影响镜像,解耦开应用和数据
- 卷会一直存在,直到没有容器使用,可以安全的卸载它
1.1.1.创建数据卷
docker提供volume子命令来管理数据卷,如下命令可以快速的在本地创建一个数据卷:
docker volume create -d local test
此时/var/lib/docker/volumes下会发现所创建的数据卷位置
除了create命令,还有inspect(查看详细信息)、ls(列出已有数据卷)、prune(清理无用数据卷)、rm(删除数据卷)等。
1.1.2.绑定数据卷
再使用docker run命令时,可以使用-mount选项来使用数据卷。
-mount选项支持三种类型的数据卷:
- volume:普通数据卷,映射到主句/var/lib/docker/volumes路径下
- bind:绑定数据卷,映射到主机指定路径下
- tmpfs:临时数据卷,只存在于内存中
栗子:使用training/webapp镜像创建一个web容器,并创建一个数据卷挂载到容器的/opt/webapp目录
docker run -d -P --name web --mount type=bind,source=/webapp,destination=/opt/wenapp training/webapp python app.py
上述命令等同于使用旧的-v标记可以再容器内创建一个数据卷:
docker run -d -P --name web -v /webapp:/opt/webapp training/webapp python app.py
注意:本地的路径必须是绝对路径,容器内的路径可以为相对路径。如果目录不存在,docker会自动创建。
docker挂载数据卷的默认权限为读写(rw),用户也可以通过ro指定为只读:
docker run -d -P --name web -v /webapp:/opt/webapp:ro training/webapp python app.py
加了ro之后,容器内对所挂载数据卷内的数据就无法修改了。
注意:如果直接挂载一个文件,在使用文件编辑工具(vi,sed等)之后,可能会造成文件inode的改变。从docker1.1.0起,这会导致报错误信息,所以推荐直接挂载文件所在的目录到容器内。
2.1.数据卷容器
如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器,但是它的目的是专门提供数据卷给其他容器挂载。
首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:
docker run -it -v /dbdata --name dbdata ubuntu
ls
显示:
bin boot dbdata dev etc home lib li64 media mnt opt proc root run sbin srv sys tmp usr var
然后可以再其他容器中使用--volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷
docker run -it --volums-from dbdata --name db1 ubuntu docker run -it --volums-from dbdata --name db2 ubuntu
此时,db1和db2都挂载了同一个数据卷到相同的/dbdata目录,三个容器任何一个在该目录下写入,其他都可以看到。
在dbdata容器中创建一个test文件:
cd /dbdata touch test
在db1容器内查看:
docker run -it --volumes-from dbdata --name db1 ubuntu ls /dbdata 显示: test
可以多次使用--volumes-from 参数来从多个容器挂载多个数据卷,还可以从其他已经挂载了容器卷的容器来挂载数据卷:
docker run -d --name db3 --volumes-from db1 training/postgres
注意:使用--volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态
如果删除了挂载的容器(dbdata、db1、db2),数据卷并不会被自动删除。要删除它,必须在删除最后一个挂载着他的容器时显示使用docker rm -v命令来指定删除关联的容器。
使用数据卷容器可以让用户在容器之间自由的升级和移动数据卷。
3.1.利用数据卷容器来迁移数据
3.1.1.备份
docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvf /backup/backup.tar /dbdata
具体分析下这个命令:
首先利用ubuntu镜像穿件一个worker容器。使用--volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷,使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用tar cvf /backup/backup.tar /dbdata 命令将/dbdata内容备份为容器内的/backup/backup.tar,即宿主机当前目录下的backup.tar
3.2.1.恢复
首先创建一个带有数据卷的容器dbdata2
docker run -v /dbdata --name dbdata2 ubuntu /bin/bash
然后创建另一个新的容器,挂载dbdata2的容器,并使用untar解压备份文件到所挂载的容器卷中
docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar
4.1.小结
数据是宝贵的。即使容器出现问题,我们也可以通过数据卷和数据卷容器对容器内的数据进行共享、迁移、备份等,快速的恢复项目或程序的运行。
另外,在生产环境中,除了使用数据卷和数据卷容器之外,还可以定期对主机数据进行备份,或使用支持容错的存储系统,包括raid或分布式文件系统,如ceph,gpfs,hdfs等。
如果不希望将数据保存在宿主机或容器当中,还可以使用tmpfs类型的数据卷,其中数据只存在于内存中,容器退出后自动删除。