Mysql删除重复数据只保留一条 - 码农知识堂

Mysql删除重复数据只保留一条
（1）以这张表为例：
```
CREATE TABLE `test`  (
  `id` varchar(32) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '注解id',
  `name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '名字',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;

INSERT INTO test (id,`name`) VALUES (replace(uuid(),'-',''),'张三'),(replace(uuid(),'-',''),'张三');
1
2
3
4
5
6
7
```
表里有两条数据，然后名字是相同的，但是id是不同的，现在要求是只留一条数据：

（2）查询name值重复的数据：

现实开发当中可能一个字段无法锁定重复值，可以采取group by多个值！利用多个值来锁定重复的行数据！
```
SELECT name FROM test GROUP BY `name` HAVING count( name ) > 1
1
```
（3）查询重复数据里面每个最小的id：
```
SELECT  min(id) as id FROM test GROUP BY `name` HAVING count( name ) > 1
1
```
（4）查询去掉重复数据最小id的其他数据：也就是要删除的数据！
```
SELECT * FROM test 
WHERE name IN ( SELECT name FROM test GROUP BY `name` HAVING count( name ) > 1 ) 
AND 
id NOT IN (SELECT min( id ) FROM test GROUP BY `name` HAVING count( NAME ) > 1)
1
2
3
4
```
（5）删除去掉重复数据最小id的其他数据：

可能这时候有人该说了，有了查询，直接改成delete不就可以了，真的是这样吗？其实不是的，如下运行报错：

首先明确一点这个错误只会发生在delete语句或者update语句，拿update来举例 : update A表 set A列 = (select B列 from A表)； 这种写法就会报这个错误，原因：你又要修改A表，然后又要从A表查数据，而且还是同层级。Mysql就会认为是语法错误！

嵌套一层就可以解决，update A表 set A列 = (select a.B列 from (select * from A表) a); 当然这个只是个示例，这个示例也存在一定的问题，比如(select a.B列 from (select * from A表) a)他会查出来多条，然后赋值的时候会报 1242 - Subquery returns more than 1 row。

嵌套一层他就可以和update撇清关系，会优先查括号里面的内容，查询结果出来过后会给存起来，类似临时表，可能有的人该好奇了，update A表 set A列 = (select B列 from A表)； 我明明加括号了呀，难道不算嵌套吗，当然不算，那个括号根本没有解决他们之间的层次关系！

详解看这篇文章：https://blog.csdn.net/weixin_43888891/article/details/127000534

（6）正确的写法：

方式一：
```
DELETE FROM test 
WHERE name IN ( select a.name from (SELECT name FROM test GROUP BY `name` HAVING count( name ) > 1) a) 
AND 
id NOT IN (select a.id from (SELECT  min(id) as id FROM test GROUP BY `name` HAVING count( name ) > 1) a)
1
2
3
4
```
注意：删除之前一定要先查询，然后再删除，否则一旦语法有问题导致删了不想删除的数据，想要恢复很麻烦！或者删除前备份好数据，不要嫌麻烦，一旦出问题，才是真正的大麻烦！

方式二：
```
DELETE FROM test 
WHERE
	id NOT IN (
	SELECT
		t.id 
FROM
	( SELECT MIN(id) as id FROM test GROUP BY NAME ) t)
1
2
3
4
5
6
7
```
（7）错误的写法： 这块我吃过一次亏，所以专门写出来，避免踩坑！

千万千万不能这么搞，下面这个语法相当于是先按name分组，然后查出来大于1的，这时候假如大于1的有很多，然后外面嵌套的那一层，只取了最小的一条数据，然后再加上使用的是NOT IN，最终会导致数据全部被删除！！！

执行前有四条数据，实际上我们要的是张三留下来一条，然后李四留下来一条

执行结果：只留下了一条！
相关阅读:
【Python Web】Flask框架（九）MYSQL+python案例
 中国帘子布市场投资前景分析及供需格局研究预测报告
 基于设计模式的绘图程序设计（大二下学期课程设计）
学习笔记-支付宝支付
 学校图书馆管理系统
 美国网站服务器解决方案
 SD 交货单过账后自动产生服务确认单据
 微观经济学论文选题怎么选?
修改http_charfinder.py使能在python311环境中运行
 native2ascii转换Unicode编码为utf-8
原文地址：https://blog.csdn.net/weixin_43888891/article/details/127336979