linux服务器系统盘坏且系统盘为软raid的修复方法

linux服务器系统盘坏且系统盘为软raid的修复方法

1 需要换新盘的情况

1.1 一块盘grub损坏修复

一块盘grub损坏修复（可通过另一块盘进入系统的情况）。更换硬盘的方式，可以热插拔，也可以服务器断电后更换，但如果是热插拔，可能会导致盘符变更。坏了一块硬盘的情况下，软raid1恢复方法(以sdb为新更换的硬盘为例)：

1.1.1 拷贝硬盘分区信息

拷贝正常的那块硬盘分区信息到新的硬盘

[root@ ~]#sfdisk -d /dev/sda | sfdisk -f /dev/sdb

1.1.2 查看sdb的分区与sda是否一致

[root@ ~]# fdisk -l /dev/sdb

Disk /dev/sdb: 300.0 GB, 300000000000 bytes

255 heads, 63 sectors/track, 36472 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Sector size (logical/physical): 512 bytes / 512 bytes

I/O size (minimum/optimal): 512 bytes / 512 bytes

Disk identifier: 0x00000000

Device Boot      Start         End      Blocks   Id System

/dev/sdb1               1         523     4194304   82 Linux swap / Solaris

Partition 1 does not end on cylinder boundary.

/dev/sdb2   *         523       36473   288773120   fd Linux raid autodetect

[root@ ~]# fdisk -l /dev/sda

Disk /dev/sda: 300.0 GB, 300000000000 bytes

255 heads, 63 sectors/track, 36472 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Sector size (logical/physical): 512 bytes / 512 bytes

I/O size (minimum/optimal): 512 bytes / 512 bytes

Disk identifier: 0x000dafc6

Device Boot      Start         End      Blocks   Id System

/dev/sda1               1         523     4194304   82 Linux swap / Solaris

Partition 1 does not end on cylinder boundary.

/dev/sda2   *         523       36473   288773120   fd Linux raid autodetect

1.1.3 让内核重载分区表

（若可以重启服务器不需执行此部）

[root@ ~]# partprobe /dev/sdb

1.1.4 把第二块盘加入raid1中

[root@ ~]# mdadm /dev/md0 -a /dev/sdb2

等数据同步到SDB 完成之后执行

1.1.5 复制操作系统的引导程序

（复制操作系统的前512字节的引导程序到新的硬盘，最关键一步，否则开机无法正常引导，现场软raid同步后没法启动就是这个原因）

[root@ ~]# dd if=/dev/sda of=/dev/sdb bs=512 count=1

ps：硬盘上第0磁道第一个扇区被称为MBR，也就是Master Boot Record，即主引导记录，它的大小是512字节，里面却存放了预启动信息、分区表信息。
系统找到BIOS所指定的硬盘的MBR后，就会将其复制到0×7c00地址所在的物理内存中。被复制到物理内存的内容就是Boot Loader，即grub。

1.1.6 添加新盘swap

[root@ ~]# mkswap /dev/sdb1

[root@ ~]# swapon /dev/sdb1

上面命令只在未重启时生效

1.1.7 修改fstab

修改fstab中已经被换掉的硬盘的UUID为新swap的UUID，保证swap重启服务器可以生效

[root@ ~]# cat /etc/fstab

UUID可通过blkid查看

1.2 两块盘grub均损坏（无法进入系统）

有一些之前已经换过系统盘，没有按照上面的操作，然后另一块也坏了，此时两块硬盘都没法进入系统，采用如下方法：

挂载光盘，进应急模式修复

Bash-4.1# chroot /mnt/sysimage

Sh-4.1# grub

Grub > root (hd0,1)

Grub> setup (hd0)

Grub> quit

Sh-4.1# exit

Bash-4.1# reboot

成功

2 不需要换盘的情况

现场存在硬盘没问题，但是掉raid的情况（大部分是这种情况）

检测方法

2.1 检查硬盘的是否正常

2.1.1 smartctl -a /dev/sdb

注意上面得输出，标注位置没有错误，表示硬盘没问题

2.1.2 smartctl -H /dev/sdb

一般用这个查就可以了，health为ok即表示硬盘没问题

2.1.3 badblocks -sv /dev/sdb

全盘扫，很慢，不建议

2.2若硬盘没问题，重新同步即可

2.2.1 检查raid状态

[root@ ~]# mdadm -D /dev/md0

/dev/md0:

        Version : 1.0

Creation Time : Tue Apr 29 15:19:50 2014

     Raid Level : raid1

     Array Size : 288772984 (275.40 GiB 295.70 GB)

Used Dev Size : 288772984 (275.40 GiB 295.70 GB)

   Raid Devices : 2

Total Devices : 2

    Persistence : Superblock is persistent

Intent Bitmap : Internal

    Update Time : Mon Jul 4 15:05:56 2016

          State : active, degraded

Active Devices : 1

Working Devices : 1

Failed Devices : 1

Spare Devices : 0

           Name : example.sz.fonsview.com:0

           UUID : 8c78cdee:b6be167c:85cce8f9:9e2fe8e8

         Events : 26915749

    Number   Major   Minor   RaidDevice State

       0       0        0        0      removed

       1       8       18        1      active sync   /dev/sdb2

       0       8        2        -      faulty spare   /dev/sda2

若红色字体部分为faulty，执行：

[root@ ~]# mdadm /dev/md0 -r /dev/sdb

[root@ ~]# mdadm /dev/md0 -a /dev/sda2

若红色字体部分为remove，执行：

[root@ ~]# mdadm /dev/md0 -a /dev/sda2

2.2.1 查看同步状态

[root@ ~]# cat /proc/mdstat
相关阅读:
蓝瓶的钙，好喝的钙——windows,我要蓝屏的
 gz文件最后四位检测
 中国Linux开源镜像站大全
 linux强制将数据写入磁盘，防止丢失内存的数据
 文件是否真的写入了磁盘？
OpenStack之日志
 使用 Nmon 监控 Linux 的系统性能
 Android获取系统cpu信息，内存，版本，电量等信息
 Android——service重启
 Android——显示当前运行所有服务，判断服务是否运行
原文地址：https://www.cnblogs.com/wenquanli/p/10278274.html

linux服务器系统盘坏且系统盘为软raid的修复方法

1 需要换新盘的情况

1.1 一块盘grub损坏修复

1.1.1 拷贝硬盘分区信息

1.1.2 查看sdb的分区与sda是否一致

1.1.3 让内核重载分区表

1.1.4 把第二块盘加入raid1中

1.1.5 复制操作系统的引导程序

1.1.6 添加新盘swap

1.1.7 修改fstab

1.2 两块盘grub均损坏（无法进入系统）

2 不需要换盘的情况

2.1 检查硬盘的是否正常

2.1.1 smartctl -a /dev/sdb

2.1.2 smartctl -H /dev/sdb

2.1.3 badblocks -sv /dev/sdb

2.2若硬盘没问题，重新同步即可

2.2.1 检查raid状态

2.2.1 查看同步状态