7月10日11:14接到一位用户反馈,访问园子时加载不了 common.cnblogs.com/script/jquery.js 这个文件。
由于这个域名用了阿里云CDN,所以我们判断可能是某个CDN节点出了问题,准备让这位用户ping common.cnblogs.com将CDN节点的IP反馈给我们。恰好这时我们也遇到了同样的问题,浏览器长时间停留在连接common.cnblogs.com的状态中:
然后ping common.cnblogs.com,ping包的响应速度很快,看来不是部分CDN节点与用户之间的网络问题。我们怀疑问题可能出在CDN与源站(我们用的是阿里云SLB)之间,为了尽快恢复正常,我们立即将common.cnblogs.com从CDN切换回SLB。
切换之后,用户反馈恢复了正常,但又反馈说static.cnblogs.com的图片不能正常显示。这又是一个使用阿里云CDN的域名,我们立即也做了切换。然后用户反馈:现在好了,飞一般的速度。
从这些情况看,显然是CDN哪个环节出了问题。
这让我们想起了6月26日遭遇的CDN故障:
当时遇到的情况是走CDN的两个域名加载文件速度奇慢,而ping CDN节点速度正常。
反馈给阿里云,阿里云排查后说出问题期间CDN节点与SLB建联失败,以为是SLB的问题,后来也就不了了之。
因为这个问题,我们有一段时间放弃了使用CDN。
后面考虑到CDN网络速度更快,而且流量费用只有SLB的一半左右,common与static又都是静态文件,于是又将这两个域名切换到了CDN上,结果又遭遇了问题。
在阿里云上一次又一次的经历证实,遇到一个问题如果不从根本上解决,下次肯定还会遇到,躲不过去的。
针对这个问题,目前我们只能先选择多花点钱少一点麻烦,静态文件也走SLB。等到阿里云从根本上解决这个问题,再考虑使用CDN。