• SQL Server 性能优化之——T-SQL NOT IN 和 NOT Exists


    这次介绍一下T-SQL中“Not IN” 和“Not Exists”的优化。

    Not IN Not Exists 命令 :

    有些情况下,需要select/update/delete 操作孤立数据。孤立数据:不存在主表中而存在其关联表中。

    操作这样的数据,一般第一反应是利用“Not in” 或 “Not Exists”命令。使用Not IN会严重影响性能,因为这个命令会逐一检查每个记录,就会造成资源紧张,尤其是当对大数据进行更新和删除操作时,可能导致资源被这些操作锁住。

    选择NOT IN 还是 NOT Exists

    现在SQL Server 中有两个命令可以使用大数据的插入、更新、删除操作,性能方面比NOT IN有很大的提高,语法简单比NOT Exists好很多,写出来的语句看上去很清爽。 现在就请它们闪亮登场,Merge 和 Except。

    例子:

    首先创建两个表

    1 use [MyTest]
    2 create table Test1 ([id] int, [name] varchar(20))
    3 create table Test2 ([id] int, [name] varchar(20), [address] varchar(100))
     
    1 declare @RowC int
    2 declare @Name varchar(20)
    3 set @RowC = 0
    4 while @RowC < 400000
    5 Begin
    6 set @Name = 'TestName' + CAST(@RowC as varchar(10))
    7 insert into Test1(id, name) values(@RowC, @Name)
    8 set @RowC = @RowC+1
    9 end
     
     1 declare @RowC int
     2 declare @Name varchar(20)
     3 declare @Address varchar(100)
     4 set @RowC = 0
     5 while @RowC < 500000
     6 Begin
     7 set @Name = 'TestName' + CAST(@RowC as varchar(10))
     8 set @Address = 'TestAddress' + CAST(@RowC as varchar(10))
     9 insert into Test2([id], [name], [address]) values(@RowC, @Name, @Address)
    10 set @RowC = @RowC+1
    11 end

    使用Not IN命令Select/update/delete操作:

    1 SELECT [name] FROM Test2 where [name] not in (select [name] from Test1)
    2 UPDATE Test2 SET [name] =N'New_Name' where [name] not in (select [name] from Test1)
    3 DELETE Test2 FROM Test2 where [name] not in (select [name] from Test1)

    使用性能更好语法更简洁的Merge and Except

    1 merge Test2 T using (select name from Test2 except select name from Test1 )S on t.name=s.name
    2 when matched then update SET name=N'New_Name' ;
    3 merge Test2 T using (select name from Test2 except select name from Test1 )S on t.name=s.name
    4 when matched then delete ;
    5 SELECT * FROM Test2 S where not exists (select 1 from Test2 inner join Test1 on Test2.name=Test1.name and Test2.name=s.name)
     

    注意,上面还是有一部分使用了Not Exists:

    1 SELECT name FROM Test2 S where not exists (select 1 from Test2 inner join Test1 on Test2.name=Test1.name and Test2.name=s.name)
    现在需要使用简洁的Except:
    1 select name from Test1 except select name from Test2

    在这里只是给出了例子,没有拿出实际的对比数据。但是Merge 和Except 两个命令在大数据的处理方面的性能,要比

    Not IN 好很多,代码简洁程度上,要比和Not EXISTS好很多。不管你信不信,反正我信了!!!

     

     上测试数据喽:Test1中有400000条数据,Test2中有500000条数据其中100000条数据的name是不同

     Select Not IN:18秒

    Select Except:几乎没有花费时间

    Update Not IN: 19秒

    Update Except、Merge:

    删除操作和上面两个操作时间基本一样,在这里就不上图片了。

    Not Exists性能上面并没有比except好多少。在我的测试数据上,两个几乎是在1秒以内完成操作的!!!

    在次谢谢@徐少侠的评价及意见,希望大家看一下。

  • 相关阅读:
    sql更细
    机器学习实战1000例(二)逻辑回归实现乳腺癌肿瘤预测
    机器学习实战1000例(一)线性回归实现广告数据分析
    微软外服工作札记②——聊聊微软的知识管理服务平台和一些编程风格
    克隆虚拟机之后更改ip报错Bringing up interface eth0: Error: No suitable device found: no device found for connection 'System eth0'.
    vmware两台虚拟机设置共享磁盘
    PowerShell创建IIS网站
    单元测发生 System.BadImageFormatException
    Asp.NET WebAPI使用文件服务
    .NET6 全局using
  • 原文地址:https://www.cnblogs.com/BoyceYang/p/3139587.html
Copyright © 2020-2023  润新知