一周的万里无云是我们的第一个目标,这周天气情况好转,但昨天/今天下午依然有乌云飘过。
昨天下午16:40~16:48左右,博客站点的两台Web服务器突然出现CPU坐过山车的波动情况。
今天下午14:26~14:32左右再次出现CPU坐过山车的波动情况,之后又出现了几次短时间的波动。
这两朵乌云飘过时,都影响了网站的正常访问。
在正常情况下博客站点的两台Web服务器的CPU占用基本在30%以内。乌云飘过的时候,访问请求并没有明显的大幅增长,而CPU占用却跳到接近100%(应用负载引起的CPU突增的可能性非常小);更奇怪的是CPU跳上去之后,会突然滑落至很低(所以美其名曰:坐过山车),这种情况之前在物理服务器中跑博客站点的时候从来没有遇到过。当阿里云怀疑缓存服务器、怀疑数据库、怀疑Windows时,我们一万个不认同。
在那段乌云密布的日子,我们最后是通过将CPU从4核升级至8核拔云见日的(详见云计算之路-阿里云上:希望从今天开始乌云变蓝天)。而8核已经是阿里云的顶级配置了,现在已经无法再通过升级CPU来解决这个问题了。
虽然没有足够的证据,虽然也许是天马行空,但是我们真的担心:阿里云的虚拟机在某种特殊的情况下会不会出现CPU处理能力波动的情况?