数据库查询结果去重常用方法整理--688IT编程网

数据库查询结果去重常⽤⽅法整理

⼀般情况下，数据库去重复有以下那么三种⽅法：

第⼀种：

两条记录或者多条记录的每⼀个字段值完全相同，这种情况去重复最简单，⽤关键字distinct就可以去掉。例：

SELECT DISTINCT * FROM TABLE

使⽤ distinct:

使⽤distinct去重，只能去掉重复记录，有些场景也并不是很适⽤，分场景⽽异

第⼆种：

两条记录之间之后只有部分字段的值是有重复的，但是表存在主键或者唯⼀性ID。如果是这种情况的话⽤DISTINCT是过滤不了的，这就要⽤到主键id的唯⼀性特点及group by分组。例：

SELECT * FROM TABLE

WHERE ID

(SELECT MAX(ID) FROM TABLE GROUP BY [去除重复的字段名列表,....])

第三种：

两条记录之间之后只有部分字段的值是有重复的，但是表不存在主键或者唯⼀性ID。这种情况可以使⽤临时表，讲数据复制到临时表并添加⼀个⾃增长的ID，在删除重复数据之后再删除临时表。例：

//创建临时表，并将数据写⼊到临时表

SELECT IDENTITY(INT1,1) AS ID,* INTO NEWTABLE(临时表) FROM TABLE

//查询不重复的数据

SELECT * FROM NEWTABLE WHERE ID IN (SELECT MAX(ID) FROM NEWTABLE GROUP BY [去除重复的字段名列表,....])

//删除临时表

DROP TABLE NEWTABLE

⼏个简单的⼩案例分享⼀下：

案例1：

需求：去重重复数据，值保留⼀条数据（重复数据完全相同，表并未设置主键）

第⼀步：先出表中重复的数据：

SELECT

CODE,

NAME,

PCODE,

count(*) AS count

FROM

lp_area_code_new_bak

GROUP BY

`CODE`

HAVING

count > 1

重复数据共12条：

第⼆步：查出不重复的数据：

数据⼀共：

去掉重复数据12条：3844-12=3832条

建个临时表，然后数据覆盖就解决问题了！

（有时脑袋就是转不过弯来，拍⼀下就出来了哈哈）

案例2：

需求分析

数据库中存在重复记录，删除保留其中⼀条（是否重复判断基准为多个字段）⼤概也分为3步来理解：

第⼀步：

查询出重复记录形成⼀个集合（临时表t2），集合⾥是每种重复记录的最⼩ID

(

SELECT

min(id) id,

user_id,

monetary,

consume_time

FROM

consum_record

GROUP BY

user_id,

monetary,

consume_time

HAVINGdistinct查询

count(*) > 1

) t2

第⼆步：

关联判断重复基准的字段

consum_record.user_id = t2.user_id

AND ary = t2.monetary

AND sume_time = t2.consume_time

第三步：

根据条件，删除原表中id⼤于t2中id的记录

最后SQL合并⼀下为：

DELETE consum_record

FROM

consum_record,

(

SELECT

min(id) id,

user_id,

monetary,

consume_time

FROM

consum_record

GROUP BY

user_id,

monetary,

consume_time

HAVING

count(*) > 1

) t2

WHERE

consum_record.user_id = t2.user_id

and ary = t2.monetary

and sume_time = t2.consume_time

AND consum_record.id > t2.id;

688IT编程网

数据库查询结果去重常用方法整理

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

数据库查询结果去重常用方法整理

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行