1、硬盘告警信息
2、故障排查
查看错误日志
# errpt -aj C62E1EB7
查看hdisk0的信息,发现hdisk0属于rootvg
# lspv
查看hdisk0的信息,发现状态是missing的
# lspv hdisk0
继续看rootvg这个卷组的状态,发现状态是stale,都不同步了,肯定是硬盘坏了
#lsvg -p rootvg
# lsvg -l rootvg
3、查看硬盘信息
查看硬盘的S/N,P/N号
#lscfg –vl hdisk0
#lscfg -vp |more
查看所有硬盘(包括逻辑盘)的状态
# lsdev -Cc disk
4、更换故障硬盘
4.1取消rootvg镜像
#chpv -c hdisk0 //去掉hdisk0的引导信息
#unmirrorvg rootvg hdisk0
4.2将坏的硬盘从rootvg中去除
#reducevg rootvg hdisk0
#rmdev -dl hdisk0 [删除硬件设备,-R强制删除]
4.3通过diag工具对坏的硬盘进行热插拔
1)运行diag 并依次选择菜单Task selection -> hot plug task -> scsi and scsi raid hot plug manager -> replace/remove a device attached to an scsi hot swap enclosure device, 选择要更换的硬盘Hdisk0 回车,保留当前界面。
2)hdisk0 硬盘的指示灯会亮(橙色),拔掉这块硬盘,将新硬盘插上。
3)回到 1)当时的界面,回车
4)再进入configure added/replaced devices 菜单进行一下配置,硬盘的物理更换就完成了。
4.4 通过lspv 查看当前硬盘的信息,正常情况下应该如下:
# cfgmgr -v //让系统识别到新设备
#lspv
hdisk0 none none
hdisk1 005a542a8a1c08ca rootvg active
#chdev -l hdisk1 -a pv=yes //给新硬盘分配PVID号
4.5 将hdisk0加入rootvg
# extendvg rootvg hdisk0
或 extendvg -f rootvg hdisk0 //强制把hdisk0加入到rootvg中
4.6 完成rootvg 的镜像
#chvg –Qn rootvg //取消rootvg的 Quorum
#mirrorvg rootvg [hdisk0] //此工作耗时较长
#syncvg –v rootvg //同步VG 可不做
#bosboot -ad /dev/hdisk0 //硬盘添加引导数据
4.7 更改引导列表
#bootlist -m normal hdisk0 hdisk1
#bootlist -m normal -o
#hdisk0
#hdisk1
5、参数注释
检看当前是使用哪块盘引导启动的
# bootinfo -b
检查 hdisk1 是否可作为由 AIX 支持的引导设备:
# bootinfo -B hdisk1
如果此命令返回值 1,则选择的磁盘可以由 AIX 引导。任何其它值表示 hdisk1 不是 rootvg 制作镜像的候选。