生产环境中使用docker的过程中,往往需要对数据进行持久化,或者需要在多个容器之间进行数据交换,这必然涉及容器的数据管理操作。容器中管理数据主要有两种方式:
①、数据卷(data volumes):容器内数据直接映射到本地主机环境;
②、数据卷容器(data volumes containers):使用特定容器维护数据卷。
1、数据卷
数据卷是一个可供容器使用的特殊目录,它将主机操作系统目录直接映射进容器,类似于linux中的mount(挂载)操作。数据卷可以提供很多有用的特性,如下所示:
①、数据卷可以在容器之间共享和重用,容器间传递数据将变得高效方便;
②、对数据卷内数据的修改会马上生效,无论是容器内操作还是本地操作;
③、对数据卷的更新不会影响镜像,解耦了应用和数据;
④、卷会一直存在,直到没有容器使用,可以安全的卸载它。
(1)、在容器内创建一个数据卷
在用docker run命令的时候,使用-v标记可以在容器内创建一个数据卷。多次重复使用-v标记可以创建多个数据卷。
下面使用镜像ubuntu:14.04镜像创建一个容器,并创建一个数据卷挂载到容器的/tmp目录下:docker run -it -v [/宿主机绝对目录:]/容器内目录 镜像名
docker run -it -v /tmp ubuntu:14.04
(2)、挂载一个主机目录作为数据卷(推荐)
使用-v标记也可以指定挂载一个本地的已有目录到容器中去作为数据卷。
docker -it -v /home/yzh/data:/tmp ubuntu:14.04
docker挂载的数据卷的默认权限是读写(rw)权限,用户可以通过ro指定为只读:
docker run -it -v /home/yzh/data:/tmp:ro ubuntu:14.04
(3)、挂载一个本地主机文件作为数据卷(不推荐)
-v标记也可以从主机挂载单个文件到容器中作为数据卷。
docker run -it -v ~/.bash_history:/.bash_history ubuntu /bin/bash
这样就可以记录在容器内使用过的命令历史了。
注意:如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或sed --in-place的时候,可能会造成文件inode的改变,从docker1.1.0开始,这回导致保错误信息。所以推荐方式是直接挂载文件所在目录。
2、数据卷容器
如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方法是使用数据卷容器。数据卷容器也是一个容器,但是他的目的是专门用来提供数据卷供其他容器挂载。首先,创建一个数据容器dbdata,并在其中创建一个数据卷挂载到/dbdata:
docker run -it -v /dbdata --name dbdata ubuntu:14.04
然后,可以在其他容器中使用--volumes-from来挂载dbdata容器中的数据卷,例如,创建db1和db2两个容器,并从dbdata容器挂载数据卷:
docker run -it --volumes-from dbdata --name db1 ubuntu:14.04 docker run -it --volumes-from dbdata --name db2 ubuntu:14.04
此时,容器db1和容器db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下面的写入,其他容器都能看到。
例如,在db2容器中创建一个1.txt文件,并写入数据:
在其他容器中都能看到。
可以多次使用--volumes-from参数来从多个容器挂载多个多个数据卷。还可以从其他已经挂载了容器卷的容器来挂载数据卷。
docker run -it --volumes-from db1 --name db3 ubuntu:14.04
提示:使用--volumes-from参数所挂载的数据卷的容器,自身并不需要保持在运行状态。
如果删除了挂载的容器(包括dbdata、db1、db2),数据卷并不会自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载这他的容器时显示使用docker rm -v命令来同时删除关联的容器。
3、利用数据卷容器来迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
(1)、备份
docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu:14.04 tar cvf /backup/backup.tar /dbdata
参数解析:
首先利用ubuntu镜像创建了一个容器worker(也就是说,使用该命令会自动创建一个名称为worker的容器),使用--volumes-from dbdata参数来让worker挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的backup目录。worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主机当前目录下的backup.tar。
补充:$(pwd)是docker支持的指定当前目录的方法,了解linux基本命令的会发现,linux查看当前目录就是pwd命令。
(2)、恢复
如果要将 数据恢复到一个容器中,可以按照下面的步骤操作。
首先,创建一个带有空数据卷的容器db3。
docker run -itd -v /dbdata --name db3 ubuntu:14.04 /bin/bash
然后,创建另一个容器,挂载db3容器卷中的数据卷,并使用untar解压备份文件到挂载的容器卷中。
docker run --volumes-from db3 -v $(pwd):/backup ubuntu:14.04 tar xvf /backup/backup.tar