k8s学习 - 概念 - Pod
这篇继续看概念,主要是 Pod 这个概念,这个概念非常重要,是 k8s 集群的最小单位。
怎么才算是理解好 pod 了呢,基本上把 pod 的所有 describe 和配置文件的配置项都能看懂就算是对 pod 比较了解了。
Pod
我们通过调用一个kubectl describe pod xxx
可以查看某个 pod 的具体信息。
describe 的信息我们用注释的形式来解读。
Name: task-pv-pod
Namespace: default // 没有指定namespace的就是default
Node: docker-for-desktop/192.168.65.3 // Pod所在的节点
Start Time: Mon, 08 Jul 2019 14:05:52 +0800 // pod启动的时间
Labels: <none> // 说明没有设置标签
Annotations: kubectl.kubernetes.io/last-applied-configuration={"apiVersion":"v1","kind":"Pod","metadata":{"annotations":{},"name":"task-pv-pod","namespace":"default"},"spec":{"containers":[{"image":"nginx","name":... // 注释信息
Status: Running // pod的状态
IP: 10.1.0.103 // pod的集群ip
Containers: // 其中包含的容器
task-pv-container:
Container ID: docker://3e9a2ee6b0a13ccee534ec3ffe781adcbff42a7f1851d57e3b374a047a654590
Image: nginx // 容器镜像名称
Image ID: docker-pullable://nginx@sha256:96fb261b66270b900ea5a2c17a26abbfabe95506e73c3a3c65869a6dbe83223a
Port: 80/TCP
Host Port: 0/TCP
State: Running
Started: Mon, 08 Jul 2019 14:05:58 +0800
Ready: True
Restart Count: 0
Environment: <none>
Mounts: // 这个容器挂载的两个volume
/usr/share/nginx/html from task-pv-storage (rw)
/var/run/secrets/kubernetes.io/serviceaccount from default-token-tw8wk (ro)
Conditions:
Type Status
Initialized True
Ready True
PodScheduled True
Volumes:
task-pv-storage: // 挂载的数据卷
Type: PersistentVolumeClaim (a reference to a PersistentVolumeClaim in the same namespace) // 这个数据卷是共享持久卷
ClaimName: task-pv-claim // 使用的声明
ReadOnly: false // 数据卷是否只读
default-token-tw8wk:
Type: Secret (a volume populated by a Secret) // 这个数据卷是保存密钥
SecretName: default-token-tw8wk
Optional: false
QoS Class: BestEffort // Qos的三个级别,Guaranteed/Burstable/BestEffort,分别对pod的资源限制从严到弱
Node-Selectors: <none> // pod是可以选择部署在哪个node上的,比如部署在有ssd的node上。
Tolerations: node.kubernetes.io/not-ready:NoExecute for 300s // 节点亲和性,它使得pod能有倾向性地分配到不同节点上。
node.kubernetes.io/unreachable:NoExecute for 300s
Events: // 这个pod发生的一些事件
Type Reason Age From Message
---- ------ ---- ---- -------
Normal Scheduled 21s default-scheduler Successfully assigned task-pv-pod to docker-for-desktop
Normal SuccessfulMountVolume 20s kubelet, docker-for-desktop MountVolume.SetUp succeeded for volume "task-pv-volume"
Normal SuccessfulMountVolume 20s kubelet, docker-for-desktop MountVolume.SetUp succeeded for volume "default-token-tw8wk"
Normal Pulling 19s kubelet, docker-for-desktop pulling image "nginx"
Normal Pulled 15s kubelet, docker-for-desktop Successfully pulled image "nginx"
Normal Created 15s kubelet, docker-for-desktop Created container
Normal Started 14s kubelet, docker-for-desktop Started container
下面我们就看 pod 的配置文件。有的时候我们可能会忘记了我们启动的pod的yaml配置文件地址,我们可以通过kubectl get pod task-pv-pod -o=yaml
命令来获取某个已经启动的 pod 的配置文件,这里的配置文件会比我们配置的配置项全很多,因为我们写配置文件的时候,很多配置项没有设置实际上就是使用默认的配置值来实现。
kubectl get pod task-pv-pod -o=yaml
apiVersion: v1
kind: Pod
metadata:
annotations:
kubectl.kubernetes.io/last-applied-configuration: |
{"apiVersion":"v1","kind":"Pod","metadata":{"annotations":{},"name":"task-pv-pod","namespace":"default"},"spec":{"containers":[{"image":"nginx","name":"task-pv-container","ports":[{"containerPort":80,"name":"http-server"}],"volumeMounts":[{"mountPath":"/usr/share/nginx/html","name":"task-pv-storage"}]}],"volumes":[{"name":"task-pv-storage","persistentVolumeClaim":{"claimName":"task-pv-claim"}}]}}
creationTimestamp: 2019-07-08T06:05:51Z
name: task-pv-pod
namespace: default
resourceVersion: "1439249"
selfLink: /api/v1/namespaces/default/pods/task-pv-pod
uid: 7090642e-a146-11e9-89ff-025000000001
spec:
containers:
- image: nginx
imagePullPolicy: Always
name: task-pv-container
ports:
- containerPort: 80
name: http-server
protocol: TCP
resources: {}
terminationMessagePath: /dev/termination-log
terminationMessagePolicy: File
volumeMounts:
- mountPath: /usr/share/nginx/html
name: task-pv-storage
- mountPath: /var/run/secrets/kubernetes.io/serviceaccount
name: default-token-tw8wk
readOnly: true
dnsPolicy: ClusterFirst
nodeName: docker-for-desktop
restartPolicy: Always
schedulerName: default-scheduler
securityContext: {}
serviceAccount: default
serviceAccountName: default
terminationGracePeriodSeconds: 30
tolerations:
- effect: NoExecute
key: node.kubernetes.io/not-ready
operator: Exists
tolerationSeconds: 300
- effect: NoExecute
key: node.kubernetes.io/unreachable
operator: Exists
tolerationSeconds: 300
volumes:
- name: task-pv-storage
persistentVolumeClaim:
claimName: task-pv-claim
- name: default-token-tw8wk
secret:
defaultMode: 420
secretName: default-token-tw8wk
status:
conditions:
- lastProbeTime: null
lastTransitionTime: 2019-07-08T06:05:52Z
status: "True"
type: Initialized
- lastProbeTime: null
lastTransitionTime: 2019-07-08T06:05:58Z
status: "True"
type: Ready
- lastProbeTime: null
lastTransitionTime: 2019-07-08T06:05:51Z
status: "True"
type: PodScheduled
containerStatuses:
- containerID: docker://3e9a2ee6b0a13ccee534ec3ffe781adcbff42a7f1851d57e3b374a047a654590
image: nginx:latest
imageID: docker-pullable://nginx@sha256:96fb261b66270b900ea5a2c17a26abbfabe95506e73c3a3c65869a6dbe83223a
lastState: {}
name: task-pv-container
ready: true
restartCount: 0
state:
running:
startedAt: 2019-07-08T06:05:58Z
hostIP: 192.168.65.3
phase: Running
podIP: 10.1.0.103
qosClass: BestEffort
startTime: 2019-07-08T06:05:52Z
几个比较复杂的配置项我们单独伶出来理解。
spec.container.imagePullPolicy
spec.container.imagePullPolicy: 这个是容器的镜像获取策略,有几种策略:
- IfNotPresent: 如果本地没有,就去远程 pull 镜像
- Always: 每次pod启动都去远程pull镜像
- Never: 只去本地获取镜像
在局域网本地化搭建镜像的时候,应该设置为 Never 。如果 imagePullPolicy 没有设置,如果设置了镜像的 tag,且 tag 不为 :lastest ,就是相当于使用 IfNotPresent。如果 imagePullPolicy 没有设置,且tag为 :lastest,就相当于是 Always.
spec.container.terminationMessagePath
spec.container.terminationMessagePath: 容器的终止日志文件。
spec.container.volumeMounts
spec.container.volumeMounts 其中一个 /usr/share/nginx/html根据 task-pv-storage 挂载到 task-pv-claim 这个共享存储中。这个pvc 是对应哪个共享存储呢?
我们可以查看 kubectl get pvc
NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE
task-pv-claim Bound task-pv-volume 1Gi RWO manual 5h
再通过 kubectl get pv
对应到 pv:
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE
task-pv-volume 1Gi RWO Retain Bound default/task-pv-claim manual 5h
再查看这个 pv 的详细情况:kubectl describe pv task-pv-volume
Name: task-pv-volume
Labels: type=local
Annotations: kubectl.kubernetes.io/last-applied-configuration={"apiVersion":"v1","kind":"PersistentVolume","metadata":{"annotations":{},"labels":{"type":"local"},"name":"task-pv-volume","namespace":""},"spec":{"ac...
pv.kubernetes.io/bound-by-controller=yes
Finalizers: [kubernetes.io/pv-protection]
StorageClass: manual
Status: Bound
Claim: default/task-pv-claim
Reclaim Policy: Retain
Access Modes: RWO
Capacity: 1Gi
Node Affinity: <none>
Message:
Source:
Type: HostPath (bare host directory volume)
Path: /Users/yejianfeng/Documents/workspace/kubernets_example/data
HostPathType:
Events: <none>
看到这个pv对应的是宿主机 HostPath 中的 /Users/yejianfeng/Documents/workspace/kubernets_example/data 这个目录。
所以共享存储的映射关系是 pod -- volume -- pvc -- pv。
其实这里我们之所以说是共享存储,就是说这个存储应该是一个共享网盘,比如 cephFS,而不应该仅仅只是宿主机上的一个目录。宿主机上的目录只是为了调试方便而已。
说说另外一个 volumeMounts: /var/run/secrets/kubernetes.io/serviceaccount
这个serviceaccount里面存储的是什么呢?我们可以直接kubectl exec -it task-pv-pod -- /bin/sh
到 pod 里面查看
~ � kubectl exec -it task-pv-pod -- /bin/sh
# cd /var/run/secrets/kubernetes.io/serviceaccount
# ls
ca.crt namespace token
里面存放的就是 token 。这个 token 是每个 namespace 一个,它表示的是在这个命名空间的用户权限。这个是给 Pod 里面的进程使用的,如果 pod 里面的进程需要调用这个命名空间里面的 K8s 的 api 或者其他服务,它就可以通过获取这个 token 来发起 http/https 的调用。这个 service account 里面存储的 token/ca.crt 就代表这个命名空间的管理员用户。
dnsPolicy
这个是 pod 的 dns 策略,可以设置有如下值:
- Default : 和宿主机的DNS完全一致
- ClusterFirst: 把集群的DNS写入到Pod的DNS配置,但是如果设置了HostNetwork=true,就会强制设置为Default
- ClusterFirstWithHostNet: 把集群的DNS写入到Pod的DNS配置,不管是否设置HostNetwork
- None: 忽略所有的DNS配置,一般来说,设置了None之后会自己手动再设置dnsConfig
这里需要了解,k8s 中的服务发现机制,有几种方式,一种是通过 service ip,一个服务在集群中统一存在一个 clusterIP, 所有其他服务需要使用这个服务的时候,就通过调用这个 clusterIP 来进行访问。另外一种是通过 dns,通过给service 设置 subdomain 来给一个服务设置一个域名,而这个域名解析就需要全集群一致。而这里的 dnsPolicy 就是做这个用处的。
restartPolicy
pod 的状态一共有五种,挂起/运行中/成功/失败/未知。
前一节说node上有个进程 kubelet 会检测当前 node 上的 pod 是否存活,如果检测到容器的状态为失败,那么就会启动重启策略,这个重启策略就是这里 restartPolicy 设置的。
- always: 容器失效时,自动重启容器
- OnFailure: 容器终止运行,且退出码不为0时候重启
- Never: 不重启
这里提到一个退出码,如果这个pod是处于失败状态,那么通过 kubectl describe pod
也是能看到 pod 的退出状态的。这个退出码0为正常,非0是不正常。
schedulerName
上节说过,调度器是在 master 节点,控制 pod 应该在哪个 node 上启动等。这里就是指定调度器的名字。默认是 default。
securityContext
定义容器 pod 或者 container 的权限和访问控制。比如可以控制 pod 使用某个用户来访问其内部的文件,是否开 selinux 等。
serviceAccount
这个概念在 volumeMounts 说过了,存储的是 pod 要访问集群内其他服务的时候的 token。
terminationGracePeriodSeconds
优雅重启,如果 k8s 要升级,或者由于某个原因要重启 pod,那么会先启动新的P od,然后发送 SIGTERM 信号,并且等待 terminationGracePeriodSeconds 个时长,再结束老的 pod。
tolerations
前面也说过,这个是设置 pod 的亲缘性,让调度器把 pod 更好的分配到 node 上去。
status.conditions
这里再提一下 pod 的生命周期,pod 在初始化,到 pending,到分配到 node 的所有过程,都有个记录,这里的 status.conditions 就是这个记录,记录各种状态变更的时间节点:
type字段是一个包含以下可能值的字符串:
- PodScheduled:Pod 已被安排到一个节点;
- Ready:Pod 能够提供请求,应该添加到所有匹配服务的负载均衡池中;
- Initialized:所有 init 容器 都已成功启动;
- Unschedulable:调度程序现在无法调度 Pod,例如由于缺少资源或其他限制;
- ContainersReady:Pod 中的所有容器都已准备就绪。
lastTransitionTime 字段提供 Pod 最后从一个状态转换到另一个状态的时间戳。
qosClass
Qos的三个级别,Guaranteed/Burstable/BestEffort,分别对pod的资源限制从严到弱。