最近运维这边的问题挺多的,也思考了很多。写在这里,做一个记录。
所以,vcenter的重要性就不言而喻了。如果vcenter宕机之后,服务器就会运行的特别特别慢,而且如果这个时候,再有一台虚拟机宕机,就会导致整个集群崩塌。
上周二vcenter毫无缘由的就宕机,让我有些措手不及。耗费了将近一周的时间,修复好之后,就一直在想,怎样能够提前避免这种情况的发生。
目前想到的方法是三种:
1,给vcenter做快照。但是咱们使用的vcenter,光是建快照,都有600G,这个方案还是算了。
2,做两个vcenter,平时使用一个vcenter,另一个平时关机,等到使用的宕机之后,立刻启用另外一个vcenter。但是前提是,你需要找到vcenter的数据存储位置,如果没有数据,再启用多少个vcenter都是没用的。所以,找到vcenter的数据存储位置,是目前来说要研究的一个内容。
3,关注服务器的硬件指标。vcenter如果要宕机的话,按照道理来说应该有一些预兆,比如说磁盘读写速度慢,服务器响应慢等,这些细微的地方,如果能够关注到,应该也是可以及时预防的。但是这个目前来说,还是有些难度,毕竟通过细微之处,观察到以后的走向,需要经验。
以上是关于vcenter管理的三个方向。
但是在这周二发生了一件事情,让我重新思考vcenter的权限分配。背景大概是这样的:大家陆陆续续都来到了万达,我就想着给小伙伴们更多的锻炼机会,那么学会通过vcenter去安装虚拟机,就是一个很好的锻炼机会。所以就暂定在周三下午大家一起玩一玩。
周二下午的时候,贺信突然慌忙过来找我,说不知道是谁在10服务器上面装了一台虚拟机。当时心就慌了,因为10服务器的压力本来就很大,如果再在它上面安装虚拟机,可能导致集群崩掉。周日上午vcenter才刚起来,有很多东西它还在同步,这个时候再给它压力,怕它承受不住。当时项目这边也是一直紧着在用,很害怕再出什么问题。所以一时没有控制好自己的情绪,打扰到了很多小伙伴。
这件事发生之后,反思了一下自己。确实是自己做的有不好的地方。所以启用了vcenter权限管理这一块。
如果正在看这篇文章的你,也在研究vcenter,也在带领着团队搭建vSphere集群,想给的建议就是,一定要做好权限分配。否则不出问题就是不出问题,一出问题,估计两三个月的时间都会浪费掉,还不算在此期间,项目没办法启动造成的损失。
公司的项目,不管是开发,测试,还是生产,但凡是需要虚拟机的项目,都部署到了一个集群里面。其实这样做不是最好的办法。因为像测试,生产,只有在项目要发布的时候,才会去使用这些虚拟机,开发的时候,是不怎么使用的,但是它们在一个集群里面,肯定会影响做开发用的虚拟机的性能,比如对磁盘的读写速度。
基于此,有一个新的想法,等回来项目不着急之后,将服务器配置比较高的几台拉出来,重新组成一个集群,然后这个配置较高的集群,只用来做开发。配置较低的几台服务器组成另外一个集群,做生产,测试用。我感觉这样做能够更好的发挥服务器的性能。
目前最重要的限制在于,磁盘的读写速度。磁盘的读写速度是一定的,但是因为虚拟机太多了,肯定有些虚拟机的请求会被忽略掉或者被阻塞。所以会导致虚拟机卡死,或者运行超级慢。对于这个问题,想的解决办法就是,拿一块固态硬盘,用作缓存,来提高对磁盘的读写速度。固态硬盘做缓存,和机械硬盘做缓存,前者对于速度的提高,可不是一倍两倍啊~
这是目前思考的两个大问题,方向也有,但是还是有技术点需要研究,攻破一下。
但凡是经历,便都是成长~
感谢您的阅读~