1、先创建临时表,把重复数据的分组条件,rowid添加到临时表
create table tb1 as
select tb.c1,tb.c2 ,max(ROWID) dataid FROM tb sc GROUP BY tb.c1,tb.c2
having count(*) > 1;
2、给临时表创建索引
create index t on tb1(c1,c2);
3、执行删除操作
delete from tb where rowid in
(select a.rowid from tb a , tb1 b where a.rowid<>b.dataid and a.c1 = b.c1
and a.c2 = b.c2);
4、删除临时表
drop table tb1
总结:此写法在表数据量很大的情况下,效率也很高。
网上有其他写法,但是效率很低,200多万数据,执行一个小时都没有结果。