故障背景:程序日志发现有程序请求数据库有大量的timeout请求
故障时间:xxx~xxx
故障排查:排查应用服务器和数据库服务器网络和其它硬件监控没有断点,数据库监控请求数当时时间段几乎为0
故障分析:目前分析可能是由于程序侧没有做探活机制导致的,数据库这边设置的超时时间为3600s,当时连接一直没有请求,所以触发了数据库的超时时间并kill掉进程,所以当应用请求
数据库时没有设置探活,不清楚数据库进程目前的状态,导致请求超时
规避方法:代码层做一个探活机制来保证进程的可用性
故障背景:程序日志发现有程序请求数据库有大量的timeout请求
故障时间:xxx~xxx
故障排查:排查应用服务器和数据库服务器网络和其它硬件监控没有断点,数据库监控请求数当时时间段几乎为0
故障分析:目前分析可能是由于程序侧没有做探活机制导致的,数据库这边设置的超时时间为3600s,当时连接一直没有请求,所以触发了数据库的超时时间并kill掉进程,所以当应用请求
数据库时没有设置探活,不清楚数据库进程目前的状态,导致请求超时
规避方法:代码层做一个探活机制来保证进程的可用性