SQL中重复数据的查询与删除--688IT编程网

SQL中重复数据的查询与删除

========第一篇=========

在一张表中某个字段下面有重复记录，有很多方法，但是有一个方法，是比较高效的，如下语句：

select data_guid from adam_entity_datas a wid > (select wid) from adam_entity_datas b where b.data_guid = a.data_guid)

如果表中有大量数据，但是重复数据比较少，那么可以用下面的语句提高效率

select data_guid from adam_entity_datas where data_guid in (select data_guid from adam_entity_datas group by data_guid having count(*) > 1)

此方法查询出所有重复记录了，也就是说，只要是重复的就选出来，下面的语句也许更高效

select data_guid from adam_entity_datas where rowid in (select rid from (select rowid rid,row_number()over(partition by data_guid order by rowid) m from adam_entity_datas) where m <> 1)

目前只知道这三种比较有效的方法。

第一种方法比较好理解，但是最慢，第二种方法最快，但是选出来的记录是所有重复的记录，而不是一个重复记录的列表，第三种方法，我认为最好。

========第二篇=========

select usercode,count(*) from ptype group by usercode having count(*) >1

========第三篇=========

出重复记录的ID:

select ID from

( select ID ,count(*) as Cnt

from 要消除重复的表

group by ID

) T1

where T1t>1

删除数据库中重复数据的几个方法

数据库的使用过程中由于程序方面的问题有时候会碰到重复数据，重复数据导致了数据库部分设置不能正确设置……

方法一

declare @max integer,@id integer

declare cur_rows cursor local for select 主字段,count(*) from

表名 group by 主字段 having count(*) > 1

open cur_rows

fetch cur_rows into @id,@max

while @@fetch_status=0

begin

select @max = @max -1

set rowcount @max

delete from 表名 where 主字段 = @id

fetch cur_rows into @id,@max

end

close cur_rows

set rowcount 0

方法二

有两个意义上的重复记录，一是完全重复的记录，也即所有字段均重复的记录，二是部分关键字段重复的记录，比如Name字段重复，而其他字段不一定重复或都重复可以忽略。

1、对于第一种重复，比较容易解决，使用

select distinct * from tableName

就可以得到无重复记录的结果集。

如果该表需要删除重复的记录，可以按以下方法删除

select distinct * into #Tmp from tableName

drop table tableName

select * into tableName from #Tmp

drop table #Tmp

2、这类重复问题通常要求保留重复记录中的第一条记录，*作方法如下

假设有重复的字段为Name,Address，要求得到这两个字段唯一的结果集

　select identity(int,1,1) as autoID, * into #Tmp from

tableName

　select min(autoID) as autoID into #Tmp2 from #Tmp group by

Name,autoID

select * from #Tmp where autoID in(select autoID from

#tmp2)

最后一个select即得到了Name，Address不重复的结果集

更改数据库中表的所属用户的两个方法

大家可能会经常碰到一个数据库备份还原到另外一台机器结果导致所有的表都不能打开了，原因是建表的时候采用了当时的数据库用户……

========第四篇=========

如何查询数据库中的重复记录？

比如说有个表中的数据是这样：

---------

查询出的结果是：

记录数量

a 3

select distinct from

b 2

c 1

怎样写这个SQL语句？

-----------------------

select distinct(name),count(*) from tabname group by name;

-------------------------------------

想出来了，这样就可以排序了。

select a1,count(a1) as total from tablename group by a1 order by total desc

--------------------------------------

select distinct(a1),count(a1) as total from tablename group by a1 order by total desc

加个distinct更有效率

--------------------------------------------------------------

select p.*, m.* from table1 p left join table2 m on p.item1=m.item2 where p.item3='#$#@%$@' order by p.item3 asc limit 10

就类似这么写

========第五篇=========

如何查数据库中的重复记录? 能在Access中用的方法

----------------------------------------------------------------------

select *

from 表 A inner join (select 字段1,字段2 from 表 group by 字段1,字段2 having Count(*)>1)

B on A.字段1=B.字段1 and A.字段2=B.字段2

--------------------------------------------------------

问题：

根据其中几个字段判断重复，只保留一条记录，但是要显示全部字段，怎么查询，谢谢！！

比如

字段1 字段2 字段3 字段4

a b c 1

a b d 2

a b d 3

b b d 2

想得到的结果为

a b c 1

a b d 2（或者3）

b b d 2

说明，根据字段1，2,3组合不重复，字段4 不考虑，得到了3个记录

但是也要显示字段4。

方法一：

可以用临时表的方法来解决：

CurrentProject.Connection.Execute "drop table temptable"

CurrentProject.Connection.Execute "select * into temptable from 表2 where 1=2"

CurrentProject.Connection.Execute "insert into temptable(字段1,字段2,字段3) SELECT DISTINCT 表2.字段1, 表2.字段2, 表2.字段3 FROM 表2;"

CurrentProject.Connection.Execute "UPDATE temptable INNER JOIN 表2 ON (表2.字段1 = temptable.字段1) AND (表2.字段2 = temptable.字段2) AND (表2.字段3 = temptable.字段3) SET temptable.字段4 = [表2].[字段4];"

方法二：

可以直接使用一个SELECT查询筛选出需要的数据：

可以假定第四字段都选值最小的

SELECT [1],[2], [3], Min([4]) AS Min4

FROM 表1

GROUP BY 表1.[1], 表1.[2], 表1.[3];

问题：

表2

id NAME r1 r2

1 1 w ee

1 1 1 1232

1 2 123 123

1 2 12 434

1 2 123 123

2 1 123 123

ID 为数值，NAME 为字符。每条记录没有唯一标识。

要求取得 ID 和 NAME 合并后不重复的记录，如有重复保留其中一条即可，但要显示所有记录。

回答：

SELECT a.*, (select top 1 r1 from 表2 as a1 where a1.id=a.id and a1.name=a.name) AS r1, (select top 1 r2 from 表2 as a2 where a2.id=a.id and a2.name=a.name) AS r2

FROM [SELECT DISTINCT 表2.id, 表2.NAME

FROM 表2]. AS a;

688IT编程网

SQL中重复数据的查询与删除

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

SQL中重复数据的查询与删除

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行