概述
最近遇到一个生产环境的问题,报错如下:
事务(进程 ID 89)与另一个进程被死锁在 锁 资源上,并且已被选作死锁牺牲品。请重新运行该事务。
拉取了请求日志,该接口有并发的请求,在同一时刻,有多个请求。分析了下代码,主要的部分是包裹在事务中,且给主要的数据更新加了数据库资源锁。可见
https://docs.microsoft.com/en-us/sql/relational-databases/system-stored-procedures/sp-getapplock-transact-sql?view=sql-server-ver15
但最后还是报了上面的错误。
分析
首先,这个报错,是数据库级别的报错。代码层面,看了几遍代码,考虑了各个场景并没有问题。也就是说,是在数据库中更新表的时候,SQL SERVER报错了。报错时有抓到报错的语句,分析了下,是更新某张表的字段时,报错的。一开始一直在分析代码层面,但是始终没思路。后台和同事分析了下报错的SQL语句。有这么一个问题,如果,在一个事务内,对表加了锁,但是这个更新比较慢,查看执行计划走的时候索引扫描;而这个时候有并发的情况,所有的请求都要执行这段更新的语句,那么就有问题了。如下
请求1更新时有一定的更新时间,并发请求2,3,4,5来了,那么都会排队,而且需要select 查询更新的table以及其他的资源,而请求1也会查询其它请求锁 锁住资源。一旦更新时间长,且SQL阻塞了,就会有死锁的问题。
解决
既然是SQL更新问题,那么第一查看的应该是索引。看了下索引,的确有关于这段更新SQL的索引,但是更新的字段顺序不对,导致走的时候索引扫描,而不是索引查找。满足索引查找的一般性结论:如果条件中包含WHERE或者ON的话,查询条件必须是位于索引集合列中首位,输出列排在其次,此时索引查找将会被使用。
where、on 关键字后面的字段要加上索引,一般建议是 过滤字段加索引,输出字段在Include中维护。如下示例
CREATE INDEX ix_roomguids_status_tradeguid ON dbo.s_Booking (RoomGUIDs, Status, tradeguid) INCLUDE (ProjGUID, CloseReason); CREATE INDEX ix_tradestatus_roomstatus ON s_Trade (TradeStatus, RoomStatus) INCLUDE (ZcOrderGUID, CloseReason); SELECT s_Trade.TradeGUID, dbo.s_Trade.RoomStatus, t.ProjGUID, t.CloseReason, s_Trade.ZcOrderGUID, dbo.s_Trade.CloseReason FROM ( SELECT * FROM dbo.s_Booking WHERE RoomGUIDs IS NOT NULL AND Status = '关闭') t INNER JOIN dbo.s_Trade ON s_Trade.TradeGUID = t.TradeGUID AND TradeStatus = '激活' AND RoomStatus = '认购';
输出结果
所以,给更新的SQL调整下索引。使其更新时走索引查找。最后解决此问题。
如果遇到死锁的问题,分析了代码,的确没问题。可以考虑导致死锁的语句会不会有性能问题,从索引着手。