https://docs.ceph.com/en/latest/cephadm/# cephad工具官网介绍
一、基础配置
Cephadm使用容器和systemd安装和管理Ceph集群,并与CLI和仪表板GUI紧密集成。
- cephadm仅支持octopus v15.2.0和更高版本。
- cephadm与新的业务流程API完全集成,并完全支持新的CLI和仪表板功能来管理集群部署。
- cephadm需要容器支持(podman或docker)和Python 3。
- 时间同步
使用的centos8来安装的ceph,已经内置了python3,不再单独安装,centos7需要单独安装python3
1、配置hosts解析
# cat /etc/hosts 192.168.40.132 node1 192.168.40.133 node2 192.168.40.134 node3
2、关闭防火墙和selinux
systemctl stop firewalld && systemctl disable firewalld setenforce 0 && sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
3、设置主机名
hostnamectl set-hostname node1 hostnamectl set-hostname node2 hostnamectl set-hostname node3
4、配置主机时间同步
dnf install -y chrony mv /etc/chrony.conf /etc/chrony.conf.bak cat > /etc/chrony.conf <<EOF server ntp.aliyun.com iburst stratumweight 0 driftfile /var/lib/chrony/drift rtcsync makestep 10 3 bindcmdaddress 127.0.0.1 bindcmdaddress ::1 keyfile /etc/chrony.keys commandkey 1 generatecommandkey logchange 0.5 logdir /var/log/chrony EOF systemctl enable chronyd systemctl restart chronyd
5、安装docker-ce
dnf config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo dnf install -y https://download.docker.com/linux/centos/7/x86_64/stable/Packages/containerd.io-1.2.13-3.1.el7.x86_64.rpm dnf -y install docker-ce --nobest sudo mkdir -p /etc/docker sudo tee /etc/docker/daemon.json <<-'EOF' { "registry-mirrors": ["https://s7owcmp8.mirror.aliyuncs.com"] } EOF sudo systemctl daemon-reload sudo systemctl restart docker sudo systemctl enable docker
二、安装cephadm
cephadm命令可以
- 引导新集群
- 使用有效的Ceph CLI启动容器化的Shell
- 帮助调试容器化的Ceph守护进程。
以下操作只在一台节点执行就可以
使用curl
获取独立脚本的最新版本。网络不好的话可直接去GitHub复制
curl --silent --remote-name --location https://github.com/ceph/ceph/raw/octopus/src/cephadm/cephadm (wget也行) chmod +x cephadm
安装cephadmn
./cephadm add-repo --release octopus ./cephadm install
引导新群集
要引导群集,需要先创建一个目录:/etc/ceph
mkdir -p /etc/ceph
然后运行该命令:ceph bootstrap
cephadm bootstrap --mon-ip 192.168.40.132
此命令将会进行以下操作:
- 为本地主机上的新群集创建monitor和manager守护程序。
- 为 Ceph 群集生成新的 SSH 密钥,并将其添加到root用户的文件
/root/.ssh/authorized_keys
- 将与新群集通信所需的最小配置文件保存到
/etc/ceph/ceph.conf
- 将
client.admin
管理(特权!)密钥的副本写入/etc/ceph/ceph.client.admin.keyring
- 将公钥的副本写入
/etc/ceph/ceph.pub
安装完成后会有一个dashboard界面
Mgr epoch 13 is available Generating a dashboard self-signed certificate... Creating initial admin user... Fetching dashboard port number... Ceph Dashboard is now available at: URL: https://node1:8443/ User: admin Password: rlvdfqj1di You can access the Ceph CLI with: sudo /usr/sbin/cephadm shell --fsid 418abd02-42a9-11eb-91f4-000c298c369a -c /etc/ceph/ceph.conf -k /etc/ceph/ceph.client.admin.keyring Please consider enabling telemetry to help improve Ceph: ceph telemetry on For more information see: https://docs.ceph.com/docs/master/mgr/telemetry/ Bootstrap complete.
浏览器访问8443
浏览器访问3000(ceph监控)
执行完成后我们可以查看ceph.conf已经写入了
[root@node1 ~]# ll /etc/ceph/ total 12 -rw-------. 1 root root 63 Dec 20 17:55 ceph.client.admin.keyring -rw-r--r--. 1 root root 179 Dec 20 17:55 ceph.conf -rw-r--r--. 1 root root 595 Dec 20 17:55 ceph.pub [root@node1 ~]# cat /etc/ceph/ceph.conf # minimal ceph.conf for 418abd02-42a9-11eb-91f4-000c298c369a [global] fsid = 418abd02-42a9-11eb-91f4-000c298c369a mon_host = [v2:192.168.40.132:3300/0,v1:192.168.40.132:6789/0]
三、启用 CEPH CLI(将ceph命令映射到本地)
cephadm shell命令在安装了所有Ceph包的容器中启动bash shell。默认情况下,如果在主机上的/etc/ceph中找到配置和keyring文件,则会将它们传递到容器环境中,以便shell完全正常工作。
# cephadm shell Inferring fsid 418abd02-42a9-11eb-91f4-000c298c369a Inferring config /var/lib/ceph/418abd02-42a9-11eb-91f4-000c298c369a/mon.node1/config Using recent ceph image ceph/ceph:v15 [ceph: root@node1 /]#
[ceph: root@node1 /]# ceph -s
cluster:
id: 418abd02-42a9-11eb-91f4-000c298c369a
health: HEALTH_WARN
OSD count 0 < osd_pool_default_size 3
services:
mon: 1 daemons, quorum node1 (age 16m)
mgr: node1.bibyjy(active, since 15m)
osd: 0 osds: 0 up, 0 in
data:
pools: 0 pools, 0 pgs
objects: 0 objects, 0 B
usage: 0 B used, 0 B / 0 B avail
pgs:
可以在节点上安装包含所有 ceph 命令的包,包括 、(用于安装 CephFS 文件系统)等
# cephadm add-repo --release octopus (官方的源) Writing repo to /etc/yum.repos.d/ceph.repo... Enabling EPEL...
添加Octopus版本的阿里的yum源
vim /etc/yum.repos.d/ceph.repo
[Ceph] name=Ceph packages for $basearch baseurl=https://mirrors.aliyun.com/ceph/rpm-octopus/el8/$basearch enabled=1 gpgcheck=0 type=rpm-md [Ceph-noarch] name=Ceph noarch packages baseurl=https://mirrors.aliyun.com/ceph/rpm-octopus/el8/noarch enabled=1 gpgcheck=0 type=rpm-md [ceph-source] name=Ceph source packages baseurl=https://mirrors.aliyun.com/ceph/rpm-octopus/el8/SRPMS enabled=1 gpgcheck=0 type=rpm-md
添加centos8的epel
库
yum install -y https://mirrors.aliyun.com/epel/epel-release-latest-8.noarch.rpm (实测,8.2虚拟机添加不上) sed -i 's|^#baseurl=https://download.fedoraproject.org/pub|baseurl=https://mirrors.aliyun.com|' /etc/yum.repos.d/epel* sed -i 's|^metalink|#metalink|' /etc/yum.repos.d/epel*
ceph好几个依赖包需要epel源
Installed: ceph-common-2:15.2.8-0.el8.x86_64 fmt-6.2.1-1.el8.x86_64 gperftools-libs-2.7-6.el8.x86_64 leveldb-1.22-1.el8.x86_64 libbabeltrace-1.5.4-3.el8.x86_64 libcephfs2-2:15.2.8-0.el8.x86_64 libibverbs-29.0-3.el8.x86_64 liboath-2.6.2-3.el8.x86_64 librabbitmq-0.9.0-2.el8.x86_64 librados2-2:15.2.8-0.el8.x86_64 libradosstriper1-2:15.2.8-0.el8.x86_64 librbd1-2:15.2.8-0.el8.x86_64 librdkafka-0.11.4-1.el8.x86_64 librdmacm-29.0-3.el8.x86_64 librgw2-2:15.2.8-0.el8.x86_64 libunwind-1.3.1-3.el8.x86_64 python3-ceph-argparse-2:15.2.8-0.el8.x86_64 python3-ceph-common-2:15.2.8-0.el8.x86_64 python3-cephfs-2:15.2.8-0.el8.x86_64 python3-prettytable-0.7.2-14.el8.noarch python3-rados-2:15.2.8-0.el8.x86_64 python3-rbd-2:15.2.8-0.el8.x86_64 python3-rgw-2:15.2.8-0.el8.x86_64 rdma-core-29.0-3.el8.x86_64
手动添加epel源
# cat epel.repo [epel] name=Extra Packages for Enterprise Linux $releasever - $basearch baseurl=https://mirrors.aliyun.com/epel/$releasever/Everything/$basearch #metalink=https://mirrors.fedoraproject.org/metalink?repo=epel-$releasever&arch=$basearch&infra=$infra&content=$contentdir enabled=1 gpgcheck=1 gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-8
安装ceph-common
# cephadm install ceph-common Installing packages ['ceph-common']...
节点cli安装成功
# ceph -v ceph version 15.2.8 (bdf3eebcd22d7d0b3dd4d5501bee5bac354d5b55) octopus (stable) # ceph -s cluster: id: 418abd02-42a9-11eb-91f4-000c298c369a health: HEALTH_WARN Reduced data availability: 1 pg inactive OSD count 0 < osd_pool_default_size 3 services: mon: 1 daemons, quorum node1 (age 15m) mgr: node1.bibyjy(active, since 15m) osd: 0 osds: 0 up, 0 in data: pools: 1 pools, 1 pgs objects: 0 objects, 0 B usage: 0 B used, 0 B / 0 B avail pgs: 100.000% pgs unknown 1 unknown
添加主机到集群
将公钥添加到新主机
ssh-copy-id -f -i /etc/ceph/ceph.pub node2 ssh-copy-id -f -i /etc/ceph/ceph.pub node3
告诉Ceph,新节点是集群的一部分
# ceph orch host add node2 Added host 'node2' # ceph orch host add node3 Added host 'node3'
添加主机会自动扩展mon和mgr节点(虚拟机测试,其余每个节点都导入镜像,过了很长时间,重启虚拟机后才加入成功)
# ceph -s cluster: id: 418abd02-42a9-11eb-91f4-000c298c369a health: HEALTH_WARN Reduced data availability: 1 pg inactive OSD count 0 < osd_pool_default_size 3 services: mon: 3 daemons, quorum node1,node2,node3 (age 39m) mgr: node1.bibyjy(active, since 40m), standbys: node2.urnpav osd: 0 osds: 0 up, 0 in data: pools: 1 pools, 1 pgs objects: 0 objects, 0 B usage: 0 B used, 0 B / 0 B avail pgs: 100.000% pgs unknown 1 unknown
standbys(备用): node2.urnpav
部署其他监视器(可选)
典型的 Ceph 群集具有三个或五个分布在不同主机的mon守护程序。如果群集中有五个或更多节点,建议部署五个mon。
当Ceph知道mon应该使用什么IP子网时,它可以随着群集的增长(或收缩)自动部署和缩放mon。默认情况下,Ceph假定其他mon使用与第一个mon的IP相同的子网。
在单个子网的情况下,如果向集群中添加主机,默认最多只会添加5个mon 如果有特定的IP子网给mon使用,可以使用CIDR格式配置该子网:
ceph config set mon public_network 10.1.2.0/24
cephadm只会在配置了特定子网IP的主机上部署mon守护程序 如果要调整特定子网mon的默认数量,可以执行以下命令:
ceph orch apply mon *<number-of-monitors>*
如果要在一组特定的主机上部署mon,可以执行以下命令:
ceph orch apply mon *<host1,host2,host3,...>*
查看当前主机和标签
# ceph orch host ls HOST ADDR LABELS STATUS node1 node1 node2 node2 node3 node3
禁用自动mon部署,执行以下命令:
ceph orch apply mon --unmanaged
要在不同网络中添加mon执行以下命令:
ceph orch apply mon --unmanaged ceph orch daemon add mon newhost1:10.1.2.123 ceph orch daemon add mon newhost2:10.1.2.0/24
添加mon到多个主机,也可以用以下命令:
ceph orch apply mon "host1,host2,host3"
部署OSD
可以用以下命令显示集群中的存储设备清单
ceph orch device ls
如果满足以下所有_条件_,则存储设备被视为可用:
- 设备必须没有分区。
- 设备不得具有任何 LVM 状态。
- 不得安装设备。
- 设备不能包含文件系统。
- 设备不得包含 Ceph BlueStore OSD。
- 设备必须大于 5 GB。
Ceph 拒绝在不可用的设备上预配 OSD。为保证能成功添加osd,我刚才在每个node上新加了一块磁盘 创建新 OSD 的方法有几种方法:
在未使用的设备上自动创建osd
# ceph orch apply osd --all-available-devices Scheduled osd.all-available-devices update...
可以看到已经在三块磁盘上创建了osd
services: mon: 3 daemons, quorum node1,node2,node3 (age 52m) mgr: node2.urnpav(active, since 74m) osd: 3 osds: 2 up (since 17m), 2 in (since 7m)
从特定主机上的特定设备创建 OSD
ceph orch daemon add osd host1:/dev/sdb
查看osd的map
# ceph osd tree ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF -1 0.05846 root default -5 0.01949 host node1 2 hdd 0.01949 osd.2 down 0 1.00000 -3 0.01949 host node2 0 hdd 0.01949 osd.0 up 1.00000 1.00000 -7 0.01949 host node3 1 hdd 0.01949 osd.1 up 1.00000 1.00000
http://docs.ceph.org.cn/rados/operations/monitoring-osd-pg/ 官网关于osd状态文档
http://docs.ceph.org.cn/rados/troubleshooting/troubleshooting-osd/#osd-not-running osd not running问题排查
启动一个down的osd
sudo /etc/init.d/ceph -a start osd.1
部署MDS
使用 CephFS 文件系统需要一个或多个 MDS 守护程序。如果使用新的ceph fs卷接口来创建新文件系统,则会自动创建这些文件 部署元数据服务器:
ceph orch apply mds *<fs-name>* --placement="*<num-daemons>* [*<host1>* ...]"
CephFS 需要两个 Pools,cephfs-data 和 cephfs-metadata,分别存储文件数据和文件元数据
# ceph osd pool create cephfs_data 64 64 # ceph osd pool create cephfs_metadata 64 64 创建一个 CephFS, 名字为 cephfs # ceph fs new cephfs cephfs_metadata cephfs_data # ceph orch apply mds cephfs --placement="3 node1 node2 node3" Scheduled mds.cephfs update... [root@node1 ~]# ceph -s data: pools: 3 pools, 129 pgs objects: 0 objects, 0 B usage: 3.0 GiB used, 57 GiB / 60 GiB avail pgs: 129 active+undersized
验证至少有一个MDS已经进入active状态,默认情况下,ceph只支持一个活跃的MDS,其他的作为备用MDS
# ceph fs status cephfs cephfs - 0 clients ====== RANK STATE MDS ACTIVITY DNS INOS 0 active cephfs.node2.xdznta Reqs: 0 /s 10 13 POOL TYPE USED AVAIL cephfs_metadata metadata 1024k 26.9G cephfs_data data 0 17.9G STANDBY MDS cephfs.node1.pemzxl MDS version: ceph version 15.2.8 (bdf3eebcd22d7d0b3dd4d5501bee5bac354d5b55) octopus (stable)
部署RGW
Cephadm将radosgw部署为管理特定领域和区域的守护程序的集合,RGW是Ceph对象存储网关服务RADOS Gateway的简称,是一套基于LIBRADOS接口封装而实现的FastCGI服务,对外提供RESTful风格的对象存储数据访问和管理接口。
使用cephadm时,radosgw守护程序是通过mon配置数据库而不是通过ceph.conf或命令行配置的。如果该配置尚未就绪,则radosgw守护进程将使用默认设置启动(默认绑定到端口80)。要在node1、node2和node3上部署3个服务于myorg领域和us-east-1区域的rgw守护进程,在部署rgw守护进程之前,如果它们不存在,则自动创建提供的域和区域:
ceph orch apply rgw myorg cn-east-1 --placement="3 node1 node2 node3"
或者可以使用radosgw-admin
命令手动创建区域、区域组和区域:
radosgw-admin realm create --rgw-realm=myorg --default radosgw-admin zonegroup create --rgw-zonegroup=default --master --default radosgw-admin zone create --rgw-zonegroup=default --rgw-zone=cn-east-1 --master --default radosgw-admin period update --rgw-realm=myorg --c
查看
# ceph orch ls NAME RUNNING REFRESHED AGE PLACEMENT IMAGE NAME IMAGE ID alertmanager 1/1 6m ago 7d count:1 docker.io/prom/alertmanager:v0.20.0 0881eb8f169f crash 3/3 6m ago 7d * docker.io/ceph/ceph:v15 5553b0cb212c grafana 1/1 6m ago 7d count:1 docker.io/ceph/ceph-grafana:6.6.2 a0dce381714a mds.cephfs 3/3 6m ago 6m node1;node2;node3;count:3 docker.io/ceph/ceph:v15 5553b0cb212c mgr 2/2 6m ago 7d count:2 docker.io/ceph/ceph:v15 5553b0cb212c mon 3/3 6m ago 6d label:mon docker.io/ceph/ceph:v15 5553b0cb212c node-exporter 3/3 6m ago 7d * docker.io/prom/node-exporter:v0.18.1 e5a616e4b9cf osd.all-available-devices 3/3 6m ago 80m * docker.io/ceph/ceph:v15 5553b0cb212c prometheus 1/1 6m ago 7d count:1 docker.io/prom/prometheus:v2.18.1 de242295e225 rgw.myorg.cn-east-1 0/3 - - node1;node2;node3;count:3 <unknown> <unknown>
一个健康的测试三节点集群
ceph常用命令
1 ceph -s #查看集群状态 2 ceph osd tree #查看osd的map 3 ceph osd lspools #查看ceph集群所有的pool 4 rbd create name --size 10G --image-feature layering#创建rbd 5 rbd ls -l #查看rbd列表 6 rbd remove rbd-name #删除rbd 7 rbd map disk01 #在客户端映射rbd map 8 rbd showmapped #显示rbd map 9 ceph osd pool create poolname pg的数量 #创建存储池 10 ceph osd pool rm poolname poolname --yes-i-really-really-mean-it #删除存储池 11 ceph fs new cephfs cephfs_metadata cephfs_data #开启ceph文件系统的pool 12 ceph fs ls #显示ceph fs(文件系统) 13 ceph mds stat #参看mds 状态 14 ssh cent@mds-nodename "sudo ceph-authtool -p /etc/ceph/ceph.client.admin.keyring" > admin.key #获取admin key 15 systemctl stop ceph-mds@mds-nodename #停止ceph-mds服务 16 ceph mds fail 0 #把mds状态重置 17 ceph fs rm cephfs --yes-i-really-mean-it #删除ceph-文件系统
https://mp.weixin.qq.com/s/5KPLCSryefAmCCeA09vv1w 使用cephadm安装ceph octopus
https://blog.csdn.net/caiyqn/article/details/106535070 CentOS8安装与配置Ceph Octopus教程