1 介绍
1.1 概念
存活探针(liveness probe):检查容器是否还在运行,可以为pod中的每个容器单独指定存活探针。如果探测失败了,K8S将定期执行探针并重新启动容器。
1.2 3种探测容器的机制:
1)HTTP GET探针对容器的IP地址(指定端口和路径)执行HTTP GET请求;探测器收到响应(2xx或3xx),则探测成功。
2)TCP套件字探针尝试与容器指定端口建立TCP连接;连接建立成功,则探测成功。
3)Exec探针在容器内执行任意命令,并检查命令的退出状态码。状态码为0,探测成功,否则,失败。
1.3 使用方式
1.3.1 通过kubectl get得到重启次数
$ kubectl get po pod_name
from K8s in Action
上图中的RESTARTS可以看到pod的容器被重启了一次;
1.3.2 获取崩溃容器的应用日志
$ kubectl logs pod_name --previous
通过--previous
选项查看前一个容器的日志。
1.3.3 查看pod描述信息
$ kubectl describe po pod_name
其中退出代码:137(128+9 SIGKILL)表示进程被外部信号终止,退出代码143(128+15 SIGTERM)
livenessProbe:
httpGet:
path: /
port: 8080
initialDelaySeconds: 15
k8s会在第一次探测前等待15s,这个初始延迟说明应用程序的启动时间。
2 探针的创建
生产中运行的pod,需要定义一个存活探针,如果没有探针,k8s无法知晓应用的存活状态。
2.1 存活探针检查
探针配置为请求特定的URL路径(/health),并让应用从内部对内部运行的所有重要组件执行状态检查,以确保没有终止或停止响应。需要确保/health HTTP端点不需要认证,否则探测会一直失败,导致容器无限重启。
2.2 轻量级
存活探针需要是轻量级的,不可以占用太多的计算资源,时长花费也需要控制。一般是在1s内执行完毕,这样可以减少主应用程序进程可用的CPU时间。重试循环无需在探针中实现,即使探针的失败阈值设置为1,k8s为了确认一次探测的失败,也会多次尝试。