墨菲定律对我的影响
如果有监控告警,而且已经预知到将来如果发生的严重性,而不进行改进或者做好备用机制的话,
那么迟早会得到深刻的教训的。
(墨菲定律)
因此,当你的redis集群没有从的时候,而出现了告警,随后恢复了,但是事情不能就此终止,
你应该着手去做备份方案,你可以再冷备一个redis集群用于故障时进行切换;
或者你可以把现在的redis集群升级成一个redis3.x的(master-slave)的集群模型
另外,对于核心的底层缓存,存储和服务,一定要能够做到存储多写,异地多活,服务集群化,
总之要能够故障时可以灵活快速切换,保证服务可用性。如果故障了,只能傻等着,什么也做不了,那么就是软件设计的架构师的无能;