【转】Sql去除重复记录拓荒者

原文地址：http://space.itpub.net/7899089/viewspace-702803

有两个意义上的重复记录，一是完全重复的记录，也即所有字段均重复的记录，二是部分关键字段重复的记录，比如Name字段重复，而其他字段不一定重复或都重复可以忽略。
1、对于第一种重复，比较容易解决，使用
select distinct * from tableName
就可以得到无重复记录的结果集。
如果该表需要删除重复的记录（重复记录保留1条），可以按以下方法删除
select distinct * into #Tmp from tableName
drop table tableName
select * into tableName from #Tmp
drop table #Tmp
发生这种重复的原因是表设计不周产生的，增加唯一索引列即可解决。

2、这类重复问题通常要求保留重复记录中的第一条记录，操作方法如下
假设有重复的字段为Name,Address，要求得到这两个字段唯一的结果集
select identity(int,1,1) as autoID, * into #Tmp from tableName
select min(autoID) as autoID into #Tmp2 from #Tmp group by Name,Address
select * from #Tmp where autoID in(select autoID from #tmp2)
最后一个select即得到了Name，Address不重复的结果集（但多了一个autoID字段，实际写时可以写在select子句中省去此列）
or
With Dups as
(
select *, row_number() over (partition by Product_Code order by Product_Code) as RowNum
from #prod
)

Delete from Dups where rownum > 1;

2021年9月北京、西安两地，高薪诚聘 .NET工程师，请私信联系！

如果认为此文对您有帮助，别忘了支持一下哦！

声明：本博客原创文字只代表本人工作中在某一时间内总结的观点或结论，与本人所在单位没有直接利益关系。转载时请在文章页面明显位置给出原文链接。

相关阅读:
Redis 如何保证缓存与数据库双写时的数据一致性
Redis 缓存雪崩和缓存穿透问题
Redis 的并发竞争 Key 问题
【转】intelliJ IDEA集成checkStyle
【转】hadoop深入研究:(十一)——序列化与Writable实现
【转】Hadoop在MapReduce中使用压缩详解
【转】JDK工具jinfo用法详解
【转】JVM统计监控工具-jstat
【转】jps命令使用
基于MLlib的机器学习--协同过滤与推荐

原文地址：https://www.cnblogs.com/youring2/p/sqltips.html

【转】Sql去除重复记录 拓荒者

【转】Sql去除重复记录拓荒者