去除重复行只保留一行,其实是一个会经常遇到的问题。
之前的方法是利用group by 来进行分组的方法来过滤,但自从SQL 2005开始软件加入了一个新的函数 ROW_NUMBER, 在消除重复行的时候就可以利用此函数。
ROW_NUMBER ( ) OVER ( [ PARTITION BY value_expression , ... [ n ] ] order_by_clause )
注: 关于ROW_NUMBER函数的更详细介绍,可以移步到 http://msdn.microsoft.com/zh-cn/library/ms186734.aspx
下面通常一个例子来说明如何得用ROW_NUMBER函数消除重复行。
1. 假如我们有一个员工表
create table employee (id varchar(50), name varchar (500))
2. 向员工表中插入一些数据,当然这里边有一些重复数据。
insert into employee (id, name) values('001', 'Jack Chan') insert into employee (id, name) values('002', 'Paul Zeng') insert into employee (id, name) values('003', 'Tony Hu') insert into employee (id, name) values('004', 'Jim Yang') insert into employee (id, name) values('004', 'Jim Yang') insert into employee (id, name) values('005', 'Ryan Zheng') insert into employee (id, name) values('005', 'Ryan Zheng')
3. 这个时候如果查询所有员工信息,你会得到一些重复数据,
id name 001 Jack Chan 002 Paul Zeng 003 Tony Hu 004 Jim Yang 004 Jim Yang 005 Ryan Zheng 005 Ryan Zheng
4. ROW_NUMBER出场了,重复行瞬间消失。
select id, name from (select id, name, row_number() over(partition by id order by id) rowid from employee) a where rowid = 1
id name 001 Jack Chan 002 Paul Zeng 003 Tony Hu 004 Jim Yang 005 Ryan Zheng
当然,这只是一个小例子,但已经足够展现row_number在消除重复记录方面的强大功能了,代码相对简单容易理解。