1、将主机进入维护模式(可选)
如果主机支持带外管理配置RAID可以不用重启,否则需要重启进入RAID卡配置RAID,有的服务器支持在esxi底层通过命令行工具(需要安装对应的软件包)对自己家的RAID卡直接配置RAID,这是也可以不重启主机
2、找到故障的磁盘进行更换,并重新配置RAID0
一般主机面板会有告警,同时硬盘故障指示灯也会亮起,也可以通过带外管理查看对应到告警来定位硬盘,下面是在vCenter上查看故障磁盘
3、声明新添加的故障磁盘(在对应的磁盘组中通过添加磁盘也应该可以,没事测试)
4、删除故障磁盘
故障的磁盘无法从vCenter界面中移除磁盘(也可能是我先更换的硬盘后移除硬盘引起的,先移除也可以但是没有测试)
5、通过命令行删除磁盘
a、命令介绍
SSH或者ESXi Shell登录到有SSD设备故障的主机;
执行如下命令确认故障磁盘设备ID:esxcli vsan storage list
此时,会看到naa.xxxxxx开头的设备; ##这种磁盘为正常可识别的磁盘
执行如下命令,从Disk Group删除掉设备:
esxcli vsan storage remove -s naa.xxxxx
命令选项包括 -d(用于磁盘)、-s(用于 SSD)和 -u(用于 VSAN 磁盘的 UUID)
可以查看这条命令的帮助信息
----------------------------------------------------------------------------------
[root@vsan13:~] esxcli vsan storage remove --help
Usage: esxcli vsan storage remove [cmd options]
Description:
remove Remove physical disks from vSAN disk groups.
Cmd options:
-d | --disk=<str> Specify individual hdd to remove from vSAN usage.e.g.: mpx.vmhba2:C0:T1:L0
-m | --evacuation-mode=<str>
Action the vSAN service must take before the host can enter maintenance mode (default noAction). Allowed values are:
ensureObjectAccessibility: Evacuate data from the disk to ensure object accessibility in the vSAN cluster, before removing the disk.
evacuateAllData: Evacuate all data from the disk before removing it.
noAction: Do not move vSAN data out of the disk before removing it.
-s | --ssd=<str> Specify a disk group's fronting ssd to remove the ssd and each backing hdd from vSAN usage.e.g.: mpx.vmhba2:C0:T1:L0
-u | --uuid=<str> Specify UUID of vSAN disk.e.g.: 52afa1de-4240-d5d6-17f9-8af1ec8509e5
-------------------------------------------------------------------------------------
b、具体操作
通过命令 esxcli vsan storage list 查看故障磁盘
故障磁盘没有naa.xxxxxx开头的字样
c、通过命令删除磁盘
参考:
https://blog.51cto.com/wangchunhai/2668349
https://blog.51cto.com/sampsondotqiu/2456607
https://blog.csdn.net/fq3758/article/details/110533065
https://www.jianshu.com/p/756e266be0d9