Oracle删除表中重复数据--688IT编程网

Oracle删除表中重复数据

我们可能会出现这种情况，某个表原来设计不周全，导致表里面的数据数据重复，那么，如何对重复的数据进行删除呢？

重复的数据可能有这样两种情况，第一种时表中只有某些字段一样，第二种是两行记录完全一样。

一、对于部分字段重复数据的删除

先来谈谈如何查询重复的数据吧。

下面语句可以查询出那些数据是重复的：

select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1

将上面的>号改为=号就可以查询出没有重复的数据了。

想要删除这些重复的数据，

可以使用下面语句进行删除

delete from 表名 a where 字段1,字段2 in

(select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)

上面的语句非常简单，就是将查询到的数据删除掉。不过这种删除执行的效率非常低，对于大数据量来说，可能会将数据库吊死。所以我建议先将查询到的重复的数据插入到一个临时表中，然后对进行删除，这样，执行删除的时候就不用再进行一次查询了。如下：

CREATE TABLE 临时表 AS

(select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)

上面这句话就是建立了临时表，

并将查询到的数据插入其中。

下面就可以进行这样的删除操作了：

delete from 表名 a where 字段1,字段2 in (select 字段1，字段2 from 临时表);

这种先建临时表再进行删除的操作要比直接用一条语句进行删除要高效得多。

这个时候，大家可能会跳出来说，什么？你叫我们执行这种语句，那不是把所有重复的全都删除吗？而我们想保留重复数据中最新的一条记录啊！大家不要急，下面我就讲一下如何进行这种操作。

在oracle中，有个隐藏了自动rowid，里面给每条记录一个唯一的rowid，*8tHV*T&管业专A}x我们如果想保留最新的一条记录，jmK\10u=教`

我们就可以利用这个字段，保留重复数据中rowid最大的一条记录就可以了。

下面是查询重复数据的一个例子：

wid,a.* from 表名 a

wid !=

(

select wid) from 表名 b

where a.字段1 = b.字段1 and

a.字段2 = b.字段2

)

下面我就来讲解一下，1("T0JI=3网aC上面括号中的语句是查询出重复数据中rowid最大的一条记录。

而外面就是查询出除了rowid最大之外的其他重复的数据了。

由此，我们要删除重复数据，只保留最新的一条数据，就可以这样写了：

delete from 表名 a

wid !=

(

select wid) from 表名 b

where a.字段1 = b.字段1 and

a.字段2 = b.字段2

)

随便说一下，上面语句的执行效率是很低的，可以考虑建立临时表，讲需要判断重复的字段、rowid插入临时表中，然后删除的时候在进行比较。

create table 临时表 as

select a.字段1,a.字段2,MAX(a.ROWID) dataid from 正式表 a GROUP BY a.字段1,a.字段2;

delete from 表名 a

wid !=

(

select b.dataid from 临时表 b

where a.字段1 = b.字段1 and

a.字段2 = b.字段2

);

commit;

Delete from 表a

wid not in

( select distinct 临时表b.dataid《－新增临时表给rowid取的列名》 from 临时表b,test

where 临时表b.id = 表a.id and 临时表b.name = test.name

)

二、对于完全重复记录的删除

对于表中两行记录完全一样的情况，可以用下面语句获取到去掉重复数据后的记录：delete in

select distinct * from 表名

可以将查询的记录放到临时表中，然后再将原来的表记录删除，最后将临时表的数据导回原来的表中。如下：

CREATE TABLE 临时表 AS (select distinct * from 表名);

drop table 正式表;

insert into 正式表 (select * from 临时表);

drop table 临时表;

如果想删除一个表的重复数据，可以先建一个临时表，将去掉重复数据后的数据导入到

临时表，然后在从

临时表将数据导入正式表中，如下：

INSERT INTO t_table_bak

select distinct * from t_table;

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

删除重复数据总的分2种：

a。删除完全重复列的数据；b。删除不完全重复列的数据。

1。删除完全重复列的数据；

这相对简单，创建一张新表(create table as (select distinct * from 原表))，删除原来的表（Drop table 原表），把新表名字重命名。

2。删除不完全重复列的数据；

这又分为重复记录保留1条，或不保留。

案例

新建表test。

create table test

(id number,

name varchar2(20)

);

select * from test;

test表列重复的数据全部删除

新建临时表test2

create table test2 as

(select name,id,count(*) shuliang from test group by name,id having count(*)>1);

--shuliang为count(*)的定义的列名。

select * from test2;

删除所有重复数据

delete from test where (id,name) in

(select id,name from test2 )

test表列重复的数据删除仅保留一条

新建临时表test3

create table test3 as

(select id ,name,max(rouwid) dataid from test

group by id,name );

select * from test3;

删除test表重复数据，重复数据保留一条

delete from test wid not in

(select distinct test3.dataid from test3,test where test3.id=test.id and test3.name=test.name );

或

delete from test wid not in

(select dataid from test3 );

688IT编程网

Oracle删除表中重复数据

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Oracle删除表中重复数据

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式