oracle删除重复数据
重复的数据可能有这样两种情况,第⼀种: 表中只有某些字段⼀样,第⼆种是两⾏记录完全⼀样。
⼀、对于部分字段重复数据的删除
1.查询重复的数据
select 字段1,字段2, count(*) from 表名 group by 字段1,字段2 having count(*) > 1
例:Select owner from dba_tables group by owner having count(*)>1;
Select owner from dba_tables group by owner having count(*)=1; //查询出没有重复的数据
2.删除重复的数据
delete from 表名 a where 字段1,字段2 in (select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1) 这种删除执⾏的效率⾮常低,对于⼤数据量来说,可能会将数据库吊死。
drop删除表另⼀种⾼效率的⽅法是先将查询到的重复的数据插⼊到⼀个临时表中,然后再进⾏删除。
CREATE TABLE 临时表 AS
(
select 字段1,字段2, count(*) as row_num
from 表名
group by 字段1,字段2
having count(*) > 1
);
上⾯这句话就是建⽴了临时表,并将查询到的数据插⼊其中。
下⾯就可以进⾏这样的删除操作了:
delete from 表名 a
where 字段1,字段2 in (select 字段1,字段2 from 临时表);
3.保留重复数据中最新的⼀条记录
在Oracle中,rowid是隐藏字段,⽤来唯⼀标识每条记录。所以,只要保留重复数据中rowid最⼤的⼀条记录就可以了。 查询重复数据:
wid,a.* from 表名 a
wid != (
select wid) from 表名 b
where a.字段1 = b.字段1 and a.字段2 = b.字段2 );
例:selete from dba_tables a
wid!=(
select max(rowid) from test b
where a.owner=b.owner);
删除重复数据,只保留最新的⼀条数据:
delete from 表名 a
wid != (
select wid) from 表名 b
where a.字段1 = b.字段1 and a.字段2 = b.字段2 )
使⽤临时表实现⾼效查询
create table 临时表 as
(select a.字段1, a.字段2, MAX(a.ROWID) as dataid from 正式表 a
GROUP BY a.字段1,a.字段2);
delete from 表名 a
wid !=
( select b.dataid from 临时表 b
where a.字段1 = b.字段1 and
a.字段2 =
b.字段2 );
commit;
⼆、对于完全重复记录的删除
对于表中两⾏记录完全⼀样的情况,可以⽤下⾯语句获取到去掉重复数据后的记录:
select distinct * from 表名
可以将查询的记录放到临时表中,然后再将原来的表记录删除,最后将临时表的数据导回原来的表中。如下:
CREATE TABLE 临时表 AS (select distinct * from 表名);
drop table 正式表;
insert into 正式表 (select * from 临时表);
drop table 临时表; 假如想删除⼀个表的重复数据,可以先建⼀个临时表,将去掉重复数据后的数据导⼊到临时表,然后在从临时表将数据导⼊正式表中,如下: INSERT INTO t_table_bak
select distinct * from t_table;
以下是补充:
Oracle 数据库中查询重复数据:
select * from employee group by emp_name having count (*)>1;
Oracle 查询可以删除的重复数据
select t1.* from employee t1 where (t1.emp_name) in (p_name from employee t2 group by emp_name having count (*)>1) p_id not in (select p_id) from employee t3 group by emp_name having count (*)>1); Oracle 删除重复数据
delete from employee t1 where (t1.emp_name) in (p_name from employee t2 group by emp_name having count (*)>1) p_id not in (select p_id) from employee t3 group by emp_name having count (*)>1);
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论