云计算之路更多分享的是我们遇到的实际问题,我们觉得实际问题更具分享价值,更能让人从中受到启发、学到东西。而且通过如何面对问题、解决问题可以更深入地了解我们所在的“云”未来是否可以长期定居。
4月26日“乌云变成蓝天”的希望成为了现实。当有人怀疑乌云是应用程序引起的时候,我们未改一行代码就解决了问题。当有人谴责我们总是怀疑云平台的问题时,实际我们在怀疑之前已经对应用程序进行了排查。
对于云平台的问题,我们喜欢小题大作,因为它影响的不是我们一家网站,而是云上成千上万的网站,而这些网站服务着成万上亿的用户。
5月1日下午17:22~17:32,蓝天之下,飘过了一朵乌云。感谢两位园友看到了乌云并向我们反馈!我们通过多个监测数据确认了这朵乌云。
1. 监控宝
2. 阿里云云监控
3. Windows性能监视器
通过监测数据,可以知道当时无法连接负载均衡(SLB)的80端口(监控宝与阿里云云监控),SLB中的云服务器未收到来自SLB的请求(Windows性能监视器),使用这台SLB的博客站点当然就无法访问。
确认了故障后,我们向阿里云提交了工单,得到的反馈是那段时间这台SLB发生了瞬时大流量导致Proxy offline(简单来说SLB相当于一个反向代理,所有请求先到SLB,再由SLB转发给云服务器),SLB与云服务器之间无流量。具体是什么原因导致了瞬时大流量,阿里云技术人员还在进一步排查。
希望阿里云早日排查出问题的真正原因,SLB的任何问题都不容小觑,因为SLB的故障是单点故障。