K8s的数据存储
在前面已经提到,容器的生命周期可能很短,会被频繁的创建和销毁。那么容器在销毁的时候,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器中的数据,Kubernetes引入了Volume的概念。
Volume是Pod中能够被多个容器访问的共享目录,它被定义在Pod上,然后被一个Pod里面的多个容器挂载到具体的文件目录下,Kubernetes通过Volume实现同一个Pod中不同容器之间的数据共享以及数据的持久化存储。Volume的生命周期不和Pod中的单个容器的生命周期有关,当容器终止或者重启的时候,Volume中的数据也不会丢失。
Kubernetes的Volume支持多种类型,比较常见的有下面的几个:
-
简单存储:EmptyDir、HostPath、NFS。
-
高级存储:PV、PVC。
-
配置存储:ConfigMap、Secret。
1、基本存储
1.1、EmptyDir
EmptyDir是最基础的Volume类型,一个EmptyDir就是Host上的一个空目录。
EmptyDir是在Pod被分配到Node时创建的,它的初始内容为空,并且无须指定宿主机上对应的目录文件,因为kubernetes会自动分配一个目录,当Pod销毁时,EmptyDir中的数据也会被永久删除。
EmptyDir的用途如下:
-
临时空间,例如用于某些应用程序运行时所需的临时目录,且无须永久保留。
-
一个容器需要从另一个容器中获取数据的目录(多容器共享目录)。
接下来,通过一个容器之间的共享案例来使用描述一个EmptyDir。
在一个Pod中准备两个容器nginx和busybox,然后声明一个volume分别挂载到两个容器的目录中,然后nginx容器负责向volume中写日志,busybox中通过命令将日志内容读到控制台。
1)、创建Pod
# volume-emptydir.yaml
apiVersion: v1
kind: Pod
metadata:
name: volume-emptydir
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
imagePullPolicy: IfNotPresent
ports:
- containerPort: 80
volumeMounts: # 将logs-volume挂载到nginx容器中对应的目录,该目录为/var/log/nginx
- name: logs-volume
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
imagePullPolicy: IfNotPresent
command: ["/bin/sh","-c","tail -f /logs/access.log"] # 初始命令,动态读取指定文件
volumeMounts: # 将logs-volume挂载到busybox容器中的对应目录,该目录为/logs
- name: logs-volume
mountPath: /logs
volumes: # 声明volume,name为logs-volume,类型为emptyDir
- name: logs-volume
emptyDir: {}
2)、查看以及访问
# 查看
kubectl get pod -n dev -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
volume-emptydir 2/2 Running 0 101s 192.168.166.141 node1 <none> <none>
# 访问
curl 192.168.166.141
3)、查看指定容器的标准输出
kubectl logs -f volume-emptydir -n dev -c busybox
Last login: Wed Aug 11 17:21:32 2021 from 192.168.209.1
[root@master ~]# kubectl logs -f volume-emptydir -n dev -c busybox
192.168.219.64 - - [11/Aug/2021:02:05:11 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.29.0" "-"
192.168.219.64 - - [11/Aug/2021:02:05:19 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.29.0" "-"
2.2、HostPath
我们已经知道EmptyDir中的数据不会被持久化,它会随着Pod的结束而销毁,如果想要简单的将数据持久化到主机中,可以选择HostPath。
HostPath就是将Node主机中的一个实际目录挂载到Pod中,以供容器使用,这样的设计就可以保证Pod销毁了,但是数据依旧可以保存在Node主机上。
1)、创建Pod
# volume-hostpath.yaml
apiVersion: v1
kind: Pod
metadata:
name: volume-hostpath
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
imagePullPolicy: IfNotPresent
ports:
- containerPort: 80
volumeMounts: # 将logs-volume挂载到nginx容器中对应的目录,该目录为/var/log/nginx
- name: logs-volume
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
imagePullPolicy: IfNotPresent
command: ["/bin/sh","-c","tail -f /logs/access.log"] # 初始命令,动态读取指定文件
volumeMounts: # 将logs-volume挂载到busybox容器中的对应目录,该目录为/logs
- name: logs-volume
mountPath: /logs
volumes: # 声明volume,name为logs-volume,类型为hostPath
- name: logs-volume
hostPath:
path: /root/logs
type: DirectoryOrCreate # 目录存在就使用,不存在就先创建再使用
type说明:
1、DirectoryOrCreate:目录存在就使用,不存在就先创建后使用。
2、Directory:目录必须存在。
3、FileOrCreate:文件存在就使用,不存在就先创建后使用。
4、File:文件必须存在。
5、Socket:unix套接字必须存在。
6、CharDevice:字符设备必须存在。
7、BlockDevice:块设备必须存在。
2)、查看以及访问
# 查看
kubectl get pod volume -hostpath -n dev -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
volume-hostpath 2/2 Running 0 23s 192.168.104.15 node2 <none> <none>
# 访问
curl 192.168.104.15
3)、在Node节点找到hostPath映射的目录文件
需要在Pod所在节点查看,此处我们需要在node2上查看
# 在此目录创建的文件,容器内部也可以看到
ls /root/logs
> access.log error.log
2.3、NFS
HostPath虽然可以解决数据持久化的问题,但是一旦Node节点故障了,Pod如果转移到别的Node节点上,又会出现问题,此时需要准备单独的网络存储系统,比较常用的是NFS和CIFS。
NFS是一个网络文件存储系统,可以搭建一台NFS服务器,然后将Pod中的存储直接连接到NFS系统上,这样,无论Pod在节点上怎么转移,只要Node和NFS的对接没有问题,数据就可以成功访问。
1)、搭建NFS服务器
首先需要准备NFS服务器,这里为了简单,直接在Master节点做NFS服务器。
在Master节点上安装NFS服务器:
yum install -y nfs-utils rpcbind
准备一个共享根目录
mkdir -pv /root/data/nfs
将共享目录以读写权限暴露给192.168.209.0/24
网段中所有的主机:
vim /etc/exports
/root/data/nfs 192.168.209.0/24(rw,no_root_squash)
修改权限
chmod 755 -R /root/data/nfs
加载配置
exportfs -r
启动nfs服务
systemctl start rpcbind
systemctl enable rpcbind
systemctl start nfs
systemctl enable nfs
在Master节点测试是否挂载成功
showmount -e 192.168.209.140
> Export list for 192.168.209.140:
> /root/data/nfs 192.168.18.0/24
在Node节点上都安装NFS服务器,目的是为了Node节点可以驱动NFS设备
# 在Node节点上安装NFS服务,不需要启动
yum -y install nfs-utils
在Node节点测试是否挂载成功
showmount -e 192.168.209.140
高可用备份方式,在所有节点执行如下的命令
mount -t nfs 192.168.209.140:/root/data/nfs /mnt
2)、创建Pod
# volume-nfs.yaml
apiVersion: v1
kind: Pod
metadata:
name: volume-nfs
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
imagePullPolicy: IfNotPresent
ports:
- containerPort: 80
volumeMounts: # 将logs-volume挂载到nginx容器中对应的目录,该目录为/var/log/nginx
- name: logs-volume
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
imagePullPolicy: IfNotPresent
command: ["/bin/sh","-c","tail -f /logs/access.log"] # 初始命令,动态读取指定文件
volumeMounts: # 将logs-volume挂载到busybox容器中的对应目录,该目录为/logs
- name: logs-volume
mountPath: /logs
volumes: # 声明volume
- name: logs-volume
nfs:
server: 192.168.209.140 # NFS服务器地址
path: /root/data/nfs # 共享文件路径
3)、查看以及访问
# 查看
kubectl get pod volume-nfs -n dev
kubectl get pod volume-nfs -n dev -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
volume-nfs 2/2 Running 0 97s 192.168.104.16 node2 <none> <none>
# 访问
curl 192.168.104.16
4)、查看nfs服务器上的共享目录
ls /root/data/nfs
> access.log error.log
cat access.log
> 192.168.219.64 - - [11/Aug/2021:03:15:55 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.29.0" "-"
2、高级存储
前面我们已经学习了使用NFS提供存储,此时就要求用户会搭建NFS系统,并且会在yaml配置nfs。由于Kubernetes支持的存储系统有很多,要求客户全部掌握,显然不现实。为了能够屏蔽底层存储实现的细节,方便用户使用,Kubernetes引入了PV和PVC两种资源对象。
-
PV(Persistent Volume)是持久化卷的意思,是对底层的共享存储的一种抽象。一般情况下PV由Kubernetes管理员进行创建和配置,它和底层具体的共享存储技术有关,并通过插件完成和共享存储的对接。
-
PVC(Persistent Volume Claim)是持久化卷声明的意思,是用户对于存储需求的一种声明。换言之,PVC其实就是用户向Kubernetes系统发出的一种资源需求申请。
使用了PV和PVC之后,工作可以得到进一步的提升
存储:存储工程师维护。
PV:Kubernetes管理员维护。
PVC:Kubernetes用户维护。
2.1、PV
1)、PV的资源清单文件
PV是存储资源的抽象。
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv2
spec:
nfs: # 存储类型,和底层正则的存储对应
path:
server:
capacity: # 存储能力,目前只支持存储空间的设置
storage: 2Gi
accessModes: # 访问模式
-
storageClassName: # 存储类别
persistentVolumeReclaimPolicy: # 回收策略
PV的关键配置参数说明:
存储类型:底层实际存储的类型,Kubernetes支持多种存储类型,每种存储类型的配置有所不同。
存储能力(capacity):目前只支持存储空间的设置(storage=1Gi),不过未来可能会加入IOPS、吞吐量等指标的配置。
访问模式(accessModes):
- 用来描述用户应用对存储资源的访问权限,访问权限包括下面几种方式:
- ReadWriteOnce(RWO):读写权限,但是只能被单个节点挂载。
- ReadOnlyMany(ROX):只读权限,可以被多个节点挂载。
- ReadWriteMany(RWX):读写权限,可以被多个节点挂载。
- 需要注意的是,底层不同的存储类型可能支持的访问模式不同。
回收策略( persistentVolumeReclaimPolicy):
- 当PV不再被使用之后,对其的处理方式,目前支持三种策略:
- Retain(保留):保留数据,需要管理员手动清理数据。
- Recycle(回收):清除PV中的数据,效果相当于
rm -rf /volume/*
。- Delete(删除):和PV相连的后端存储完成volume的删除操作,常见于云服务器厂商的存储服务。
- 需要注意的是,底层不同的存储类型可能支持的回收策略不同。
存储类别(storageClassName):PV可以通过storageClassName参数指定一个存储类别。
- 具有特定类型的PV只能和请求了该类别的PVC进行绑定。
- 未设定类别的PV只能和不请求任何类别的PVC进行绑定。
状态(status):一个PV的生命周期,可能会处于4种不同的阶段。
- Available(可用):表示可用状态,还未被任何PVC绑定。
- Bound(已绑定):表示PV已经被PVC绑定。
- Released(已释放):表示PVC被删除,但是资源还没有被集群重新释放。
- Failed(失败):表示该PV的自动回收失败。
2)、准备工作(准备NFS环境)
创建目录以及授权
mkdir -pv /root/data/{pv1,pv2,pv3} && chmod 777 -R /root/data
修改/etc/exports文件
vim /etc/exports
/root/data/pv1 192.168.209.0/24(rw,no_root_squash)
/root/data/pv2 192.168.209.0/24(rw,no_root_squash)
/root/data/pv3 192.168.209.0/24(rw,no_root_squash)
重启nfs服务
systemctl restart nfs
3)、创建PV
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv1
spec:
nfs: # 存储类型,和底层正则的存储对应
path: /root/data/pv1
server: 192.168.209.140
capacity: # 存储能力,目前只支持存储空间的设置
storage: 1Gi
accessModes: # 访问模式
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain # 回收策略
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv2
spec:
nfs: # 存储类型,和底层正则的存储对应
path: /root/data/pv2
server: 192.168.209.140
capacity: # 存储能力,目前只支持存储空间的设置
storage: 2Gi
accessModes: # 访问模式
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain # 回收策略
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv3
spec:
nfs: # 存储类型,和底层正则的存储对应
path: /root/data/pv3
server: 192.168.209.140
capacity: # 存储能力,目前只支持存储空间的设置
storage: 3Gi
accessModes: # 访问模式
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain # 回收策略
4)、查看PV
kubectl get pv -o wide
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE VOLUMEMODE
pv1 1Gi RWX Retain Available 15s Filesystem
pv2 2Gi RWX Retain Available 15s Filesystem
pv3 3Gi RWX Retain Available 15s Filesystem
2.2、PVC
1)、PVC的资源清单
PVC是资源的申请,用来声明对存储空间,范根模式,存储类别需求信息。
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc
namespace: dev
spec:
accessModes: # 访客模式
-
selector: # 采用标签对PV选择
storageClassName: # 存储类别
resources: # 请求空间
requests:
storage: 5Gi
PVC的关键配置参数说明:
访客模式(accessModes):用于描述用户应用对存储资源的访问权限。
用于描述用户应用对存储资源的访问权限:
选择条件(selector):通过Label Selector的设置,可使PVC对于系统中已存在的PV进行筛选。
存储类别(storageClassName):PVC在定义时可以设定需要的后端存储的类别,只有设置了该class的pv才能被系统选出。
资源请求(resources):描述对存储资源的请求。
2)、创建PVC
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc1
namespace: dev
spec:
accessModes: # 访客模式
- ReadWriteMany
resources: # 请求空间
requests:
storage: 1Gi
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc2
namespace: dev
spec:
accessModes: # 访客模式
- ReadWriteMany
resources: # 请求空间
requests:
storage: 1Gi
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc3
namespace: dev
spec:
accessModes: # 访客模式
- ReadWriteMany
resources: # 请求空间
requests:
storage: 5Gi
3)、查看PVC和PV
# 查看PVC
kubectl get pvc -n dev -o wide
NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE VOLUMEMODE
pvc1 Bound pv1 1Gi RWX 15s Filesystem
pvc2 Bound pv2 2Gi RWX 15s Filesystem
pvc3 Pending 15s Filesystem
# 发现PVC3一直处于Pending,因为没有PV分配
# 查看pv
kubectl get pv -o wide # 发现pv1和pv2已经被pvc1和pvc2绑定
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE VOLUMEMODE
pv1 1Gi RWX Retain Bound dev/pvc1 6m46s Filesystem
pv2 2Gi RWX Retain Bound dev/pvc2 6m46s Filesystem
pv3 3Gi RWX Retain Available 6m46s Filesystem
4)、创建Pod使用PVC
apiVersion: v1
kind: Pod
metadata:
name: pod1
namespace: dev
spec:
containers:
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","while true;do echo pod1 >> /root/out.txt; sleep 10; done;"]
volumeMounts:
- name: volume
mountPath: /root/
volumes:
- name: volume
persistentVolumeClaim:
claimName: pvc1
readOnly: false
---
apiVersion: v1
kind: Pod
metadata:
name: pod2
namespace: dev
spec:
containers:
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","while true;do echo pod1 >> /root/out.txt; sleep 10; done;"]
volumeMounts:
- name: volume
mountPath: /root/
volumes:
- name: volume
persistentVolumeClaim:
claimName: pvc2
readOnly: false
5)、查看pod
kubectl get pods -n dev
NAME READY STATUS RESTARTS AGE
pod1 1/1 Running 0 7s
pod2 1/1 Running 0 7s
6)、查看NFS中的文件存储
ls /root/data/pv1
ls /root/data/pv2
2.3、生命周期
PVC和PV是一一对应的,PV和PVC之间的相互作用遵循如下的生命周期。
-
资源供应:管理员手动创建底层存储和PV。
-
资源绑定:
- 用户创建PVC,Kubernetes负责根据PVC声明去寻找PV,并绑定在用户定义好PVC之后,系统将根据PVC对存储资源的请求在已存在的PV中选择一个满足条件的。
- 一旦找到,就将该PV和用户定义的PVC进行绑定,用户的应用就可以使用这个PVC了。
- 如果找不到,PVC就会无限期的处于Pending状态,直到系统管理员创建一个符合其要求的PV。
- PV一旦绑定到某个PVC上,就会被这个PVC独占,不能再和其他的PVC进行绑定了。
-
资源使用:用户可以在Pod中像volume一样使用PVC,Pod使用Volume的定义,将PVC挂载到容器内的某个路径进行使用。
-
资源释放:
- 用户删除PVC来释放PV。
- 当存储资源使用完毕后,用户可以删除PVC,和该PVC绑定的PV将会标记为“已释放”,但是还不能立刻和其他的PVC进行绑定。通过之前PVC写入的数据可能还留在存储设备上,只有在清除之后该PV才能再次使用。
-
资源回收:
- Kubernetes根据PV设置的回收策略进行资源的回收。
- 对于PV,管理员可以设定回收策略,用于设置与之绑定的PVC释放资源之后如何处理遗留数据的问题。只有PV的存储空间完成回收,才能供新的PVC绑定和使用。
3、配置存储
3.1、ConfigMap
ConfigMap是一个比较特殊的存储卷,它的主要作用是用来存储配置信息的。
1)、ConfigMap的资源清单文件
apiVersion: v1
kind: ConfigMap
metadata:
name: configMap
namespace: dev
data: # <map[string]string>
xxx
2)、创建ConfigMap
# configmap.yaml
apiVersion: v1
kind: ConfigMap
metadata:
name: configmap
namespace: dev
data:
info:
username:admin
password:123456
3)、创建Pod
# pod-configmap.yaml
apiVersion: v1
kind: Pod
metadata:
name: pod-configmap
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
volumeMounts:
- mountPath: /configmap/config
name: config
volumes:
- name: config
configMap:
name: configmap
4)、查看Pod
kubectl get pod pod-configmap -n dev
NAME READY STATUS RESTARTS AGE
pod-configmap 1/1 Running 0 13s
5)、进入容器查看配置
kubectl exec -it pod-configmap -n dev /bin/sh
cd /configmap/config
cat info
> username:admin password:123456
6)、动态修改
ConfigMap中的key映射为一个文件,value映射为文件中的内容。如果更新了ConfigMap中的内容,容器中的值也会动态更新。
# 修改
kubectl edit cm configmap -n dev
# 再次进入容器查看
kubectl exec -it pod-configmap -n dev /bin/sh
cd /configmap/config
cat info
> username:admin password:12345678910
3.2、Secret
在Kubernetes中,还存在一种和ConfigMap非常类似的对象,称为Secret对象,它主要用来存储敏感信息,例如密码、密钥、证书等等。
1)、准备数据
# 使用base64对数据进行编码
echo -n "admin" | base64
YWRtaW4=
echo -n "123456" | base64
MTIzNDU2
2)、创建Secret
apiVersion: v1
kind: Secret
metadata:
name: secret
namespace: dev
type: Opaque
data:
username: YWRtaW4=
password: MTIzNDU2
3)、查看
kubectl describe secret secret -n dev
Name: secret
Namespace: dev
Labels: <none>
Annotations:
Type: Opaque
Data
====
password: 6 bytes # 发现只显示字符个数
username: 5 bytes
4)、创建Pod
# pod-secret.yaml
apiVersion: v1
kind: Pod
metadata:
name: pod-secret
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
volumeMounts:
- mountPath: /secret/config
name: config
volumes:
- name: config
secret:
secretName: secret
5)查看pod并进入容器
# 查看pod
kubectl get pod pod-secret -n dev
NAME READY STATUS RESTARTS AGE
pod-secret 1/1 Running 0 3s
# 进入容器
kubectl exec -it pod-secret -n dev /bin/sh
more /secret/config/username
> admin # 发现已经正常解码