• 两个事务 update同一张表出现的死锁问题 (转载)


    引言

    近来做省一级计算机一级考试系统的时候,学生端进行大批量判分的时候,出现了这样的问题(事务(进程 ID 262)与另一个进程被死锁在 锁 资源上,并且已被选作死锁牺牲品。请重新运行该事务。):

    这个就是我们在代码中写了大批量的update语句,用trace Profiler ,我们对死锁追踪是这样的:

    分析:

    我们来分析一下上面的图,上面为DeakLock graph,图中左右两边的椭圆形相当于一个处理节点(Process Node),当鼠标移动到上面的时候,可以看到内部执行的代码,如update,Insert,Delete等等,有打叉的左边的椭圆形就是牺牲者,没有打叉的为优胜者。中间两个长方形就是一个资源节点(Resource Node),描述数据库中的对象,如一个表、一行或者一个索引。在我们当前的实例中,描述的是:假设左边的椭圆形为Process Node1,右边的椭圆形为Process Node2,上面的长方形为Resource Node1,下面为Resource Node2,Process Node1对Resource Node1申请一个U锁,但是,Resource Node1被Process Node2的X锁占有;另一边,Process Node2对Resource Node2申请一个U锁,但是Resource Node2被Process Node1的X锁占有。这样就形成了一个资源占有的死循环,这个时候,sql server会在sq_lock中检测到死锁,这个时候,就会出现一个牺牲品的事情,以至于系统能够继续运行。

    我们可以看一下,两个事务分为什么:

    右边的Process Node2为:

    可以粗略的看到,是两个update语句出现了死锁的问题。

    那么为什么两条update语句会出现死锁的问题呢?我们通过一个简单的数据库进行模拟一下当时两条update语句的死锁。

    模拟:


    下面是我们的建表语句:

    SET ANSI_NULLS ON  
    GO  
    SET QUOTED_IDENTIFIER ON  
    GO  
    CREATE TABLE [dbo].[table1](  
     [A] [nvarchar](10) NULL,  
     [B] [nvarchar](10) NOT NULL,  
     [C] [nvarchar](10) NULL  
    ) ON [PRIMARY]  
    GO  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa1', N'b1', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa2', N'b3', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b4', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b5', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b2', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b6', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b7', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b8', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa1', N'b9', N'11')
    
    
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa1', N'b1', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa2', N'b3', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b4', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b5', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b2', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b6', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b7', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa3', N'b8', N'11')  
    INSERT [dbo].[table1] ([A], [B], [C]) VALUES (N'aa1', N'b9', N'11')

    我们第一个update事务为:

    SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED
    begin tran  
       print convert(nvarchar(30),convert(datetime,getdate(),121),121)  
         update t_table  
         set A='aa1'  
         where B='b3'  
       print convert(nvarchar(30),convert(datetime,getdate(),121),121)  
       EXEC sp_lock @@spid  
       
       waitfor  delay '00:00:10'  
      
         update t_table  
         set A='aa2'  
         where B='b8'  
         EXEC sp_lock @@spid  
       print convert(nvarchar(30),convert(datetime,getdate(),121),121)  
    commit tran

    第二个update事务为:

    SET TRANSACTION ISOLATION LEVEL Read UNCOMMITTED  
    begin tran  
    update table1   
    set A='aa3'  
    where B='b1'  
    
    EXEC sp_lock @@spid  
    commit tran

    两个事物首先我们触发事务一,然后紧接着,我们触发事务二,这个时候,消息中出现:

    这个时候,我们追踪死锁的时候,是这样的:

    两个Process Node节点执行的事务为:

    可以看到,其实是我们上面写的事务,一个是牺牲品,另外一个为优胜品。那么我们现在最大的疑问,就是,他们的申请U锁和X锁,是如何形成死锁的呢?

    我们首先看一下现在table1表中的数据:

    我们把数据放到Excel中进行分析:

    首先我运行事务一(Process Node1),我们看看它的代码:首先要进行这一步:update table1  set A='aa1' where B='b3' ,系统运行这一步的时候,是从第一条数据开始加上U锁的,当检查到第二条数据的时候,U锁发现,符合B='b3'时,将U锁升级为X锁,这个时候,我们就在第一条蓝线这里表示为X,接下来,继续对第3条记录进行U锁,然后为第4条,第5条,到了第11条的时候,又存在了符合B='b3'时,将U锁升级为X锁,也就是我表示的第二条蓝线,继续加U锁,发现,整张表都已经所扫描完了,没有存在符合条件的了,这个时候,如果Process Node1到这里就运行完了,我们应该释放X锁,但是Process Node1,后面还有代码:waitfor  delay '00:00:10'  ,也就是等待了10秒钟,这个时候,只要事务不执行完成,X锁不会释放。

    而此时,我已经运行了事务二(Process Node2),我们看到它的代码是: update table1  set A='aa3'  where B='b1',通过上面说明,我们同样分析一下该update语句的执行过程,Process Node2将table1中的数据从第一条开始加U锁,这个时候,第一条数据就符合 B='b1',这个时候,U锁升级为X锁,继续往下执行的时候,发现第二条数据已经被Process  Node1的X锁占有,X锁为排它锁的原因为不与其他锁兼容,也就是说,不能加U锁,这个时候,Process Node2只能等待Process Node1将X锁释放,而Process Node1 没有执行完成,是不会释放X锁的,所以Process Node2 等待Process Node1释放第二条记录的X锁。

    这个时候,我们发现Process Node1中waitfor  delay '00:00:10' ,代码已经运行完成,之后,进行update table1 set A='aa2' where B='b8'代码,这条语句从第一条数据开始加U锁,但是,我们发现第一条数据已经被Process Node2的X锁占用,也就是说,Process Node1需要等待Process Node2 的X锁释放才行,所以Process Node1 在第一条记录这里等待。

    我们最后看到的应该是这样的:

    因此出现了上面的现象,就是Process Node2 想要对Resource Node1(第二条记录)请求U锁,但是,Resource Node1 被Process Node1 的X锁占用,而Process Node2 想要对Resource Node2(第一条记录)请求U锁,但是Resource Node2被Process Node2 的X锁占用。


    解决方案:

    我们的解决方案是这样的,在B的字段加上非聚集索引,就可以了,为什么呢?应为聚集索引和非聚集索引加U锁的时候,都不是整张表进行扫描的,而是直接就可以根据索引找到这条记录进行升级锁,所以,不会出现上面的死锁的问题。

    结束语:

    对于数据库锁的问题,我们要懂得锁的运行原理。不要仅仅停留在表面上,有时候,我们需要动手模拟sql server的运行原理来解决我们数据库中的死锁问题,原理很重要。

    原文链接

  • 相关阅读:
    [Xcode 实际操作]八、网络与多线程-(16)使用网址会话对象URLSession下载图片并显示下载进度
    [Xcode 实际操作]八、网络与多线程-(15)使用网址会话对象URLSession下载图片并存储在沙箱目录中
    leetcode第一刷_Best Time to Buy and Sell Stock II
    Unity 武器拖尾效果
    Android环境搭建 NDK+ADT(免cywgin)
    ros下单目相机校正
    Valid Phone Numbers
    ExtJS4.2.1与Spring MVC实现Session超时控制
    Kafka具体解释二、怎样配置Kafka集群
    OutOfMemoryError: Java heap space和GC overhead limit exceeded在Ant的Build.xml中的通用解决方式
  • 原文地址:https://www.cnblogs.com/OpenCoder/p/6603058.html
Copyright © 2020-2023  润新知