• 【转】Sql去除重复记录 拓荒者


    原文地址:http://space.itpub.net/7899089/viewspace-702803

    有两个意义上的重复记录,一是完全重复的记录,也即所有字段均重复的记录,二是部分关键字段重复的记录,比如Name字段重复,而其他字段不一定重复或都重复可以忽略。
    1、对于第一种重复,比较容易解决,使用
            select   distinct   *   from   tableName
    就可以得到无重复记录的结果集。
    如果该表需要删除重复的记录(重复记录保留1条),可以按以下方法删除
            select   distinct   *   into   #Tmp   from   tableName
            drop   table   tableName
            select   *   into   tableName   from   #Tmp
            drop   table   #Tmp
    发生这种重复的原因是表设计不周产生的,增加唯一索引列即可解决。

    2、这类重复问题通常要求保留重复记录中的第一条记录,操作方法如下
            假设有重复的字段为Name,Address,要求得到这两个字段唯一的结果集
            select   identity(int,1,1)   as   autoID,   *   into   #Tmp   from   tableName
            select   min(autoID)   as   autoID   into   #Tmp2   from   #Tmp   group   by   Name,Address
            select   *   from   #Tmp   where   autoID   in(select   autoID   from   #tmp2)
            最后一个select即得到了Name,Address不重复的结果集(但多了一个autoID字段,实际写时可以写在select子句中省去此列)
    or
    With Dups as
    (
        select *, row_number() over (partition by Product_Code order by Product_Code) as RowNum
        from #prod
    )


    Delete from Dups where rownum > 1;

    2021年9月 北京、西安两地,高薪诚聘 .NET工程师,请私信联系!
    如果认为此文对您有帮助,别忘了支持一下哦!
    声明:本博客原创文字只代表本人工作中在某一时间内总结的观点或结论,与本人所在单位没有直接利益关系。转载时请在文章页面明显位置给出原文链接。
  • 相关阅读:
    Redis 如何保证缓存与数据库双写时的数据一致性
    Redis 缓存雪崩和缓存穿透问题
    Redis 的并发竞争 Key 问题
    【转】intelliJ IDEA集成checkStyle
    【转】hadoop深入研究:(十一)——序列化与Writable实现
    【转】Hadoop在MapReduce中使用压缩详解
    【转】JDK工具jinfo用法详解
    【转】JVM统计监控工具-jstat
    【转】jps命令使用
    基于MLlib的机器学习--协同过滤与推荐
  • 原文地址:https://www.cnblogs.com/youring2/p/sqltips.html
Copyright © 2020-2023  润新知