在生产环境中,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享。
容器中数据管理有两种方式:
- 数据卷(data volumes): 容器内数据直接映射到本地主机环境
- 数据卷容器(data volume containers): 使用特定容器维护数据卷
数据卷
是一个可供容器使用的特殊目录,它将主机操作系统目录自己解映射进容器,类似linux中的 mount 行为
数据卷特性:
- 可以在容器间共享和重用
- 对数据卷内数据修改会立马生效,无论是容器内操作还是本地操作
- 对数据卷的操做不会影响镜像,解耦开应用和数据
- 卷会一直存在,直到没有数据使用,可以安全的卸载它
1.创建数据卷
- docker volume create -d local test
查看 /var/lib/docker/volumes 路径下,会发现test
docker volume 还支持:
- inspect: 查看详细信息
- ls: 列出已有数据卷
- prune: 清理无用数据卷
- rm: 删除数据卷
2.绑定数据卷
在创建容器时,将主机本地的任意路径挂在到容器内作为数据卷
- docker [container] run --mount
支持的选项:
- volume: 普通数据卷,映射到主机 /var/lib/docker/volumes 路径下
- bind: 绑定数据卷,映射到主机指定路径下
- tmpfs: 临时数据卷,只存在于内存中
下面使用 training/webapp 镜像创建一个web容器,并创建一个数据卷挂载到 /opt/webapp 目录:
docker run -d -P --name web --mount type=bind,source=/webapp,destination=/opt/webapp training/webapp python app.py
等同于使用旧的 -v 标记:
docker run -d -P --name web -v /webapp:/opt/webapp training/webapp python app.py
本地目录路径必须时绝对路径,容器路径可以是相对路径。如果路径不存在,docker自动创建
默认权限为读写,可以通过 ro 指定为只读:
docker run -d -P --name web -v /webapp:/opt/webapp:ro training/webapp python app.py
如果直接挂在一个文件到容器,使用编辑工具的时候可能会造成文件 inode 的改变,从docker1.1.0起,这会导致报错误信息。所以推荐挂在文件所在的目录到容器
数据卷容器
在多个容器之间共享一些持续更新的数据
也是一个容器,目的是专门提供数据卷给其他容器挂载
首先,创建一个数据卷容器 dbdata,并在其中创建一个数据卷挂载道 /dbdata:
- docker run -it -v /dbdata --name dbdata ubuntu
然后,可以在其他容器中使用 --volumes-from 来挂载 dbdata 容器中的数据卷,例如,创建 db1和db2 两个容器,并从dbdata 容器挂在数据卷:
- docker run -it --volumes-from dbdata --name db1 ubuntu
- docker run -it --volumes-from dbdata --name db2 ubuntu
此时,容器 db1 和 db2 都挂载同一个数据卷到相同的 /dbdata 目录,三个容器任何一方在该目录下的写入,其他容器都可以看到。
可以使用多次 --volumes-from 参数从多个容器挂载多个数据卷,还可以从其他已经挂载了容器卷的容器来挂载数据卷:
docker run -d --name db3 --volumes-from db1 training/postgres
NOTE: 使用 --volumes-from 参数所挂载数据卷的容器自身并不需要保持在运行状态
如果删除了挂载的容器(包括dbdata,db1,db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显示的使用 docker rm -v 命令来指定同时删除关联的容器。
使用数据卷容器,可以在容器之间自由的升级和移动数据卷
利用数据卷容器来迁移数据
1.备份
docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvf /backup/backup.tar /dbdata
- 首先利用ubuntu镜像创建了一个容器 worker
- 使用 --volumes-from dbdata 使worker 容器挂载 dbdata 容器的数据卷(即 dbdata数据卷)
- 使用 -v $(pwd):/backup 挂载本地的当前目录道容器的 /backup 目录
- worker 容器启动后,使用 tar cvf /backup/backup.tar /dbdata 命令,将 /dbdata 下内容备份为容器内的 /backup/backup.tar,即宿主主机当前目录下的 backup.tar。
2.恢复
- 首先创建一个带有数据卷的容器 dbdata2:
docker run -v /dbdata --name dbdata2 ubuntu /bin/bash
- 然后创建另外一个新的容器,挂载 dbdata2的容器,使用 untar解压备份文件到所挂载的容器卷中:
docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf
在生产环境中,在使用数据卷和数据卷容器之外,定期将本地数据进行备份,或者使用支持容错的存储系统,包括RAID或分布式文件系统,如Ceph,GPFS,HDFS等。
另外,有些时候不希望数据保存在宿主机或容器中,还可以使用 tmpfs 类型的数据卷,其中数据只保存在内存中,容器退出后自动删除。