MySQL 数据库删除表中重复数据

采集数据的时候，由于先期对页面结构的分析不完善，导致采漏了一部分数据。完善代码之后重新运行 Scrapy，又采集了一些重复的数据，搜了下删除重复数据的方法。

N.B. 删除数据表的重复数据时，请先备份数据表。

方法一

# 保留主键 ID 较小的那条记录
DELETE n1 FROM names n1, names n2 WHERE n1.id > n2.id AND n1.name = n2.name

# 保留主键 ID 较大的那条记录
DELETE n1 FROM names n1, names n2 WHERE n1.id < n2.id AND n1.name = n2.name

方法二

# 保留主键 ID 较大的那条记录
DELETE FROM NAMES
 WHERE id NOT IN (SELECT * 
                    FROM (SELECT MIN(n.id)
                            FROM NAMES n
                        GROUP BY n.name) x)

# 保留主键 ID 较小的那条记录
DELETE FROM NAMES
 WHERE id NOT IN (SELECT * 
                    FROM (SELECT MAX(n.id)
                            FROM NAMES n
                        GROUP BY n.name) x)

P.S. 当数据表的数据量较多时，建议使用方法二，大大节省时间。

参考链接：

相关阅读:
UVALive-8077 Brick Walls 找规律
UVALive-8079 Making a Team 排列组合公式化简
UVALive-8072 Keeping On Track 树形dp 联通块之间缺失边的个数
HDU-5534 Partial Tree 完全背包设定初始选择
HDU-2844 Coins 多重背包物品数量二进制优化
CodeForces-366C Dima and Salad 对01背包的理解多个背包问题
HDU-2955 Robberies 浮点数01背包自变量和因变量位置互换
UVALive-7197 Axles 动态规划多个背包问题
广义表(C++实现)
稀疏矩阵及稀疏矩阵的压缩存储

原文地址：https://www.cnblogs.com/imzhi/p/mysql-remove-duplicate-records.html