前言
docker的系统学习可以看我这篇博文:https://www.cnblogs.com/zisefeizhu/p/11298818.html 有非常详细的讲解
容器现在都是用kubernetes来编排了, 存储、网络、都归Kubernetes层面管理了,所以对于docker的主要掌握点也就剩dockerfile了,这也是docker的重点。
简介
Dockerfile是一个文本文件,里面包含一条条指令,每一条指令就是一层镜像。
Dockerfile 一般分为四部分:基础镜像信息、维护者信息、镜像操作指令和容器启动时执行指令,’#’ 为 Dockerfile 中的注释。
Docker以从上到下的顺序运行Dockerfile的指令。为了指定基本镜像,第一条指令必须是FROM。一个声明以#
字符开头则被视为注释。
Dockerfile中所用的所有文件一定要和Dockerfile文件在同一级父目录下,可以为Dockerfile父目录的子目录。
Dockerfile中相对路径默认都是Dockerfile所在的目录。
Dockerfile中一定要惜字如金,能写到一行的指令,一定要写到一行,原因是分层构建,联合挂载这个特性。Dockerfile中每一条指令被视为一层。
Dockerfile中指明大写(约定俗成)
dockerfile 图解
dockerfile详解
FROM
指定基础镜像,并且必须是第一条非注释指令。
如果不以任何镜像为基础,那么写法为:FROM scratch。
同时意味着接下来所写的指令将作为镜像的第一层开始
语法:
FROM <image>
FROM <image>:<tag>
FROM <image>:<digest>
三种写法,其中<tag>和<digest> 是可选项,如果没有选择,那么默认值为latest
在一个 Dockerfile 文件中创建多个镜像时,FROM 可以多次出现。只需在每个新命令 FROM 之前,记录提交上次的镜像 ID。
LABEL
功能是为镜像指定标签
语法:
LABEL <key>=<value> <key>=<value> <key>=<value> ...
一个Dockerfile种可以有多个LABEL,不建议这么写,最好是写成一行,如太长需要换行的话则使用符号
LABEL会继承基础镜像中的LABEL,如遇到key相同,则值覆盖
ENV
设置环境变量
语法:
ENV <key> <value>
ENV <key>=<value> ...
两者的区别就是第一种是一次设置一个,第二种是一次设置多个
ADD
一个复制命令,把文件复制到镜像中
如果把虚拟机与容器想象成两台linux服务器的话,那么这个命令就类似于scp,只是scp需要加用户名和密码的权限验证,而ADD不用
语法:
ADD <src>... <dest>
ADD ["<src>",... "<dest>"]
路径的填写可以是容器内的绝对路径,也可以是相对于工作目录的相对路径,推荐写成绝对路径
可以是一个本地文件或者是一个本地压缩文件,还可以是一个url
如果把写成一个url,那么ADD就类似于wget命令
src为一个目录的时候,会自动把目录下的文件复制过去,目录本身不会复制
如果src为多个文件,dest一定要是一个目录
如果 docker 发现文件内容被改变,则接下来的指令都不会再使用缓存。关于复制文件时需要处理的/,基本跟正常的 copy 一致
COPY
看这个名字就知道,又是一个复制命令
语法:
COPY <src>... <dest>
COPY ["<src>",... "<dest>"]
与ADD的区别:
COPY的只能是本地文件,其他用法一致
RUN
功能为运行指定的命令
语法:
RUN <command>
RUN ["executable", "param1", "param2"]
第一种后边直接跟shell命令
在linux操作系统上默认 /bin -c
在windows操作系统上默认 cmd /S /C
第二种是类似于函数调用。
可将executable理解成为可执行文件,后面就是两个参数。
RUN 指令创建的中间镜像会被缓存,并会在下次构建中使用。如果不想使用这些缓存镜像,可以在构建时指定 --no-cache 参数,如:docker build --no-cache。
CMD
功能为容器启动时要运行的命令
语法:
CMD ["executable","param1","param2"]
CMD ["param1","param2"]
CMD command param1 param2
第三种比较好理解了,就时shell这种执行方式和写法
第一种和第二种其实都是可执行文件加上参数的形式
举例说明两种写法:
CMD [ "sh", "-c", "echo $HOME"
CMD [ "echo", "$HOME" ]
这里边包括参数的一定要用双引号,就是",不能是单引号。千万不能写成单引号。
原因是参数传递后,docker解析的是一个JSON array
RUN&&CMD
RUN是构件容器时就运行的命令以及提交运行结果
CMD是容器启动时执行的命令,在构件时并不运行,构件时仅仅指定了这个命令到底是做什么的
WORKDIR
设置工作目录,对RUN,CMD,ENTRYPOINT,COPY,ADD生效。如果不存在则会创建,也可以设置多次。
语法:
WORKDIR /path/to/workdir
WORKDIR也可以解析环境变量
ENV DIRPATH /path
WORKDIR $DIRPATH/$DIRNAME
RUN pwd
pwd的执行结果是/path/$DIRNAME
VOLUME
实现挂载功能,可以将宿主机目录挂载到容器中
可用专用的文件存储当作Docker容器的数据存储部分
语法:
VOLUME ["/data"]
使用场景为需要持久化存储数据时.
容器使用的是AUFS,这种文件系统不能持久化数据,当容器关闭后,所有的更改都会丢失。
所以当数据需要持久化时用这个命令。
VOLUME ["/var/log/"]
VOLUME /var/log
VOLUME /var/log /var/db
卷可以容器间共享和重用
容器并不一定要和其它容器共享卷
修改卷后会立即生效
对卷的修改不会对镜像产生影响
卷会一直存在,直到没有任何容器在使用它
VOLUME 让我们可以将源代码、数据或其它内容添加到镜像中,而又不并提交到镜像中,并使我们可以多个容器间共享这些内容。
USER
设置启动容器的用户,可以是用户名或UID
语法:
USER daemo
USER UID
如果设置了容器以daemon用户去运行,那么RUN, CMD 和 ENTRYPOINT 都会以这个用户去运行,
使用这个命令一定要确认容器中拥有这个用户,并且拥有足够权限。
ENTRYPOINT
启动时的默认命令
语法:
ENTRYPOINT ["executable", "param1", "param2"]
ENTRYPOINT command param1 param2
第一种就是可执行文件加参数
第二种就是写shell
ENTRYPOINT&&CMD
相同点:
只能写一条,如果写了多条,那么只有最后一条生效
容器启动时才运行,运行时机相同
不同点:
ENTRYPOINT不会被运行的command覆盖,而CMD则会被覆盖
如果我们在Dockerfile种同时写了ENTRYPOINT和CMD,并且CMD指令不是一个完整的可执行命令,那么CMD指定的内容将会作为ENTRYPOINT的参数。
FROM ubuntu
ENTRYPOINT ["netstat", "-ln"]
CMD ["-tup"]
如果在Dockerfile种同时写了ENTRYPOINT和CMD,并且CMD是一个完整的指令,那么它们两个会互相覆盖,谁在最后谁生效
FROM ubuntu
ENTRYPOINT ["netstat", "-ln"]
CMD ls -l
那么将执行ls -l ,netstat -ln不会执行。
ARG
设置变量命令,ARG命令定义了一个变量,在docker build创建镜像的时候,使用 --build-arg =来指定参数
语法:
ARG <name>[=<default value>]
如果用户在build镜像时指定了一个参数没有定义在Dockerfile中,那么将有一个Warning
[Warning] One or more build-args [foo] were not consumed.
可以定义一个或多个参数
FROM busybox
ARG user1
ARG buildno
可以给参数一个默认值
FROM busybox
ARG user1=someuser
ARG buildno=1
如果给了ARG定义的参数默认值,那么当build镜像时没有指定参数值,将会使用这个默认值
HEALTHCHECK
容器健康状况检查命令
语法:
HEALTHCHECK [OPTIONS] CMD command
HEALTHCHECK NONE
第一个的功能是在容器内部运行一个命令来检查容器的健康状况
第二个的功能是在基础镜像中取消健康检查命令
[OPTIONS]的选项支持以下三中选项:
–interval=DURATION 两次检查默认的时间间隔为30秒
–timeout=DURATION 健康检查命令运行超时时长,默认30秒
–retries=N 当连续失败指定次数后,则容器被认为是不健康的,状态为unhealthy,默认次数是3
注意:
HEALTHCHECK命令只能出现一次,如果出现了多次,只有最后一个生效。
CMD后边的命令的返回值决定了本次健康检查是否成功,具体的返回值如下:
0: success - 表示容器是健康的
1: unhealthy - 表示容器已经不能工作了
2: reserved - 保留值
例:
HEALTHCHECK --interval=5m --timeout=3s
CMD curl -f http://localhost/8080 || exit 1
健康检查命令是:curl -f http://localhost/8080 || exit 1
两次检查的间隔时间是5秒
命令超时时间为3秒
ONBUILD
用于在dockerfile中定义一个触发器,只对当前镜像的子镜像生效
语法:
ONBUILD [INSTRUCTION]
dockerfile用于build镜像文件,此镜像文件亦可作为base image被另一个dockerfile用作FROM指令参数,并以之构建新的镜像,在后面的dockerfile中的FROM指令在build过程中被执行时,将会触发创建其baseimage的dockerfile文件中的ONBUILD指令定义的触发器。
比如当前镜像为A,在Dockerfile种添加:
ONBUILD RUN ls -l
这个 ls -l 命令不会在A镜像构建或启动的时候执行
此时有一个镜像B是基于A镜像构建的,那么这个ls -l 命令会在B镜像构建的时候被执行。
EXPOSE
功能为暴漏容器运行时的监听端口给外部
语法:
EXPOSE <port>/<tcp/udp>
但是EXPOSE并不会使容器访问主机的端口
EXPOSE 指令并不会让容器监听 host 的端口,如果需要,需要在 docker run 时使用 `-p`、`-P` 参数来发布容器端口到 host 的某个端口上。
STOPSIGNAL
STOPSIGNAL命令是的作用是当容器停止时给系统发送什么样的指令,默认是15
语法:
STOPSIGNAL signal
Dockerfile中使用变量的方式
$varname
${varname}
${varname:-default value}
${varname:+default value}
第一种和第二种相同
第三种表示当变量不存在使用-号后面的值
第四种表示当变量存在时使用+号后面的值
原则及建议
容器轻量化。从镜像中产生的容器应该尽量轻量化,能在足够短的时间内停止、销毁、重新生成并替换原来的容器。
使用 .gitignore。在大部分情况下,Dockerfile 会和构建所需的文件放在同一个目录中,为了提高构建的性能,应该使用 .gitignore 来过滤掉不需要的文件和目录。
为了减少镜像的大小,减少依赖,仅安装需要的软件包。
一个容器只做一件事。解耦复杂的应用,分成多个容器,而不是所有东西都放在一个容器内运行。如一个 Python Web 应用,可能需要 Server、DB、Cache、MQ、Log 等几个容器。一个更加极端的说法:One process per container。
减少镜像的图层。不要多个 Label、ENV 等标签。
对续行的参数按照字母表排序,特别是使用apt-get install -y安装包的时候。
使用构建缓存。如果不想使用缓存,可以在构建的时候使用参数--no-cache=true来强制重新生成中间镜像。
实战
我的一篇docker实战博文