• Sql Server中三种字符串合并方法的性能比较


    文章来自:博客园-DotNet菜园

    最近正在处理一个合并字符吕的存储过程,在一个测试系统的开发中,要使用到字符串合并功能,直接在Sql中做。
    示例:
    有表內容﹕
    名称  內容
    1     abc
    1      aaa
    1      dddd
    2      1223
    2       fkdjfd
    --------------------------------
    结果﹕
    1   abc,aaa,dddd
    2   1223,fkdjfd
    要求用一条SQL语句实现﹐如﹕select sum(內容) from table group by 名称

    --该问题,一共使用了三种方法,并分别测试了一下这三种方法的各自的性能
    1: 创建处理函数
    2 :  sql 2005及以上版本中的新的解决方法,FOR XML
    3 :  使用临时表实现字符串合并处理的示例

    说明:以下测试是以本人机器的硬件配置为准,根据硬件配置的不同,结果可能不同。


    1: 创建处理函数
           说明:sql 全系列版本

    CREATE FUNCTION dbo.f_strHeBin(@id int)
    RETURNS varchar(8000)
    AS
    BEGIN
        DECLARE @r varchar(8000)
        SET @r = ''
        SELECT @r = @r + ',' + value
        FROM tb
        WHERE id=@id
        RETURN STUFF(@r, 1, 1, '')
    END
    GO
    -- 调用函数

    SELECt id, values=dbo.f_strHeBin(id)
    FROM tb
    GROUP BY id

    以上方式得到的是根据ID合并的所有记录,如果要得到相应的单一ID的记录,则还需要添加一条语句:
    假设:以上结果入到临时表3t3中:
    SELECT id,max(values) as values FROM #t3 GROUP BY id

    go

    分析结果如下:
    SQL Server 分析和编译时间: 
       CPU 时间 = 0 毫秒,占用时间 = 7 毫秒。
    1--使用sql 全系列版本,自定义合并函数方式

    SQL Server 执行时间:
       CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
    表 'Worktable'。扫描计数 1,逻辑读取 4030 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'tb'。扫描计数 2,逻辑读取 46 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

    SQL Server 执行时间:
       CPU 时间 = 1397254 毫秒,占用时间 = 1463680 毫秒。

    (1969 行受影响)

    (218 行受影响)
    表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 '#t3___000067'。扫描计数 1,逻辑读取 16 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

    SQL Server 执行时间:
       CPU 时间 = 0 毫秒,占用时间 = 84 毫秒。

    SQL Server 执行时间:
       CPU 时间 = 0 毫秒,占用时间 = 2 毫秒。

    总计耗时计:24.4分钟,这才1969行记录,这个方法看来在这种情况下不可取。


    2 :  sql 2005及以上版本中的新的解决方法,FOR XML

    select id,stuff(
    (select '-' + convert(varchar(4),value)
    from tb
    where id=A.id
    order by id
    for xml path('')
    ),1,1,'') as values 
    from tb A
    group by   id

    go

    分析结果如下:

    SQL Server 分析和编译时间: 
       CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。

    SQL Server 执行时间:
       CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
    表 'Worktable'。扫描计数 439,逻辑读取 32978 次,物理读取 0 次,预读 0 次,lob 逻辑读取 319 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'tb'。扫描计数 4,逻辑读取 92 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

    SQL Server 执行时间:
       CPU 时间 = 1856 毫秒,占用时间 = 1955 毫秒。

    总计耗时:2秒钟。不过这个方法随着记录数量的增加,性能也随之降低,在数据记录达到20000条的时候,耗时将近2.5分钟。

    3 :  使用临时表实现字符串合并处理的示例

    SELECT id ,values=CAST(value as varchar(8000))
    INTO #t2 FROM tb
    ORDER BY id

    DECLARE @col1 varchar(5),@col2 varchar(8000)
    UPDATE #t2 SET
        @col2=CASE WHEN @col1=id THEN @col2+'-'+values ELSE values END,
        @col1=zo3,
        qs=@col2


    SELECT id,max(values) values FROM #t2 group by id

    drop table #t2


    go

    分析结果如下:


    SQL Server 分析和编译时间: 
       CPU 时间 = 7 毫秒,占用时间 = 7 毫秒。

    SQL Server 执行时间:
       CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
    表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
    表 'tb'。扫描计数 2,逻辑读取 46 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

    SQL Server 执行时间:
       CPU 时间 = 734 毫秒,占用时间 = 769 毫秒。

    (2012 行受影响)
    表 '#t2___________000000000065'。扫描计数 1,逻辑读取 1677 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

    SQL Server 执行时间:
       CPU 时间 = 62 毫秒,占用时间 = 62 毫秒。

    (2012 行受影响)
    表 '#t2__________000000000065'。扫描计数 1,逻辑读取 849 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。

    SQL Server 执行时间:
       CPU 时间 = 16 毫秒,占用时间 = 7 毫秒。

    (218 行受影响)

    SQL Server 执行时间:
       CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。

    SQL Server 执行时间:
       CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。


       总计耗时:769ms+62ms+15ms=846ms,总费时1秒钟不到,当数据记录达到20000条记录时,性能损耗也不太严重,在6-10秒左右。能够接受。

  • 相关阅读:
    ADO.Net对Oracle数据库的操作(转)
    代码反思(1)
    继承与多态
    存储过程
    linux学习流程及内容概括
    Linux下终端快捷键
    查找算法
    epoll解读
    TCP/udp编程
    如何学习嵌入式
  • 原文地址:https://www.cnblogs.com/HeShui/p/3642556.html
Copyright © 2020-2023  润新知