1. 一次有趣的事
有个做技术的(不说什么岗位,容易被人喷,谁都有失手的时候),在公司的业务测试环境的机器,卸载了一个软件rpm -e --nodeps filesystem*
, 导致机器所有的命令都不能用。看看我们的聊天截图:
然后我问他为什么要操作了,linux 一切皆文件, 看关键字也不能随便卸载
啊
安装了一个haproxy
。这里我好奇为啥安装了一个haproxy 要卸载 filesystem ,是在网上随便瞎找的文档吗?
我给他说我的解决办法:
现在首要问题,解决故障。
2. 模拟故障
我用我自己的机器来模拟他的故障
[root@mongo-162 ~]# rpm -e --nodeps filesystem
3. 修复故障
重启系统,进入救援模式
3.1 挂载系统镜像到服务器,进入救援模式
1 、通过bios ,选择光盘启动进入到安装 CentOS 7 的界面
2、选择Trubleshooting
3、选择 Rescue a CentOS system
系统救援模式
4、选择1
进入
根据你的环境,找到你的系统目录在哪
3.2 进行故障修复
怎么修复,你需要找到那个filesystem 这个软件包,然后安装上
1、找到filesystem的rpm 包
find / -name "filesystem*"
2、安装这个rpm 包
安装之前首先你要知道你的系统的路径,然后去安装,不是rpm -ivh rpm包这样直接安装,需要加参数
,如下:
cd /run/install/repo/Packages rpm -ivh filesystem-* --root=/mnt/sysimage/
3、重启系统,选择硬盘启动
登录验证是否修复成功
ok,修复成功
4. 小结
1、做什么操作,可以在自己哪个测试机器做一些安装测试操作,不要去公司业务各种环境去做测试。
2、不要随便相信网上写的文章, 因为网上有时候是过时的一些环境(比如:操作系统,应用程序,参数配置,各种网络限制的等等)或许很多情况能解决,但是你自己下手之前想想能造成什么后果。
3、公司规范明确一下, 比如运维规范,dba规范, 开发技术规范,服务器使用规范(规范可以不需要很多页纸,但一定要简洁明了),这样可以很大程度避免一些故障,解决起来也比较方便。
注:所以我写自己文章,自己能看懂才是真理,网上东西太多,太杂,很多时候都不适用自己。