网络编程
位置:首页>> 网络编程>> 数据库>> 教你轻松解决几种常见的SQL疑难问题(2)

教你轻松解决几种常见的SQL疑难问题(2)

作者:10631  发布时间:2009-01-07 14:25:00 

标签:

要求:

过滤掉所有多余的重复记录

(1)我们知道distinct、group by 可以过滤重复,于是就有最直观的

select distinct * from emp

select name,age from emp group by name,age

获得需要的数据,如果可以使用临时表就有解法:

select distinct * into #tmp from emp

delete from emp

insert into emp select * from #tmp

(2)但是如果不可以使用临时表,那该怎么办?

我们观察到我们没办法区分数据(物理位置不一样,对 SQL Server来说没有任何区别),思路自然是想办法把数据区分出来了,既然现在的所有的列都没办法区分数据,唯一的办法就是再加个列让它区分出来,加什么列好?最佳选择是identity列:

alter table emp add chk int identity(1,1)

表示例:

name age chk

Tom 16 1

Sun 14 2

Tom 16 3

Tom 16 4

重复记录可以表示为:

select * from emp

where

(select count(*) from emp e where e.name=emp.name)>1

要删除的是:

delete from emp

where

(select count(*) from emp e where

e.name=emp.name and e.chk>=emp.chk)>1

再把添加的列删掉,出现结果。

alter table emp drop column chk

(3)另一个思路:

视图

select min(chk)

from emp

group by name

having count(*) >1

获得有重复的记录chk最小的值,于是可以

delete

from emp

where

chk not in

(

select min(chk)

from emp

group by name

)

写成join的形式也可以:

(1)有例表:emp

emp_no name age

001 Tom 17

002 Sun 14

003 Tom 15

004 Tom 16

◆要求生成序列号

(1)最简单的方法,根据b问题的解法:

alter table emp add chk int identity(1,1)

或 select *,identity(int,1,1) chk into #tmp from emp

◆如果需要控制顺序怎么办?

select top 100000 *,identity(int,1,1)

chk into #tmp from emp order by age

(2) 假如不可以更改表结构,怎么办?

如果不可以唯一区分每条记录是没有办法的,在可以唯一区分每条记录的时候,可以使用a 中的count的思路解决这个问题

select emp.*,(select count(*) from

emp e where e.emp_no<=emp.emp_no)

from emp

order by (select count(*) from

emp e where e.emp_no<=emp.emp_no)

0
投稿

猜你喜欢

手机版 网络编程 asp之家 www.aspxhome.com