背景:想在表中随机取10条记录,让取出来的数据不重复(表中必须是有个递增列,且递增从1开始间隔为1)。
数据表:
CREATE TABLE testable
(
id INT IDENTITY(1,1),
myname NVARCHAR(1000),
insertedTime DATETIME DEFAULT SYSDATETIME()
)
表中共有100条数据,如下
1. 首先想到的是MSSQL自带的newid()
采用这种方法时,需要将表中所有记录与newid()生成的值进行比较从而进行排序。因此,如果表中的记录较多,操作会非常缓慢。
USE Gift163DBgoSELECT TOP 14 * FROM dbo.testable ORDER BY NEWID()
缺点:1. 取出的10条数据会出现重复 2.当数据表数据很多的时候,速度将很慢 (每次重新计算newid)
2. 自定义函数返回一个表,表中记录的是随机生成的N个id值。
1)rand()生成随机数 rand()*count,CEILING,floor用法
2)如果临时表中无此数据,则放入,否则重新生成
3)直到N条记录已经生成
注意:标量函数function内不能出现rand()方法,变通下生成个view v_random,然后在函数内调用 v_random获取随机数
create view v_randomASselect CEILING(rand()*51) as random --注意51,生成的是1到51之间的数字,因为事先知道数据库中有51条记录go
自定义函数代码如下:
ALTER FUNCTION randomIntStringWithCommaSplit(@counts int) –counts 表明返回的个数RETURNS @t TABLE (filed1 int) --返回表@t,有个int类型的 field列ASBEGINDECLARE @randomInt INTDECLARE @i INTSET @i=0WHILE @i<@countsBEGINselect @randomInt= random FROM v_random--不能是 SET @randomInt=SELECT random FROM v_random
IF NOT EXISTS(SELECT TOP 1 * FROM @t WHERE filed1=@randomInt)BEGININSERT INTO @t VALUES (@randomInt)SET @i=@i+1ENDENDRETURNEND
上面函数返回的是一个表类型,表中有个int字段,存放要查找的N个不同的keyId (keyId为要查找表的递增列,且递增为1,从1开始递增)
所以返回的表中存放的数据是 dbo.Articles中的id列的值。
使用:调用上面的自定义函数返回10个不重复的id
SELECT * FROM randomIntStringWithCommaSplit(10)
下面是几次的执行结果,可以看到每个结果中都不存在重复的值(fidled1为临时表的唯一列)
最后通过 select * from table where id in randomIntStringWithCommaSplit(10) ,这样就可以从table中随机取出10条不重复的数据来了。
3.存储过程取不重复的数据
--dbo.getRandomDataFromTable
--输入参数 @tableName nvarchar(100),--表名
---@dataCount nvarchar(100)--取N条数据
输出结果集:列id,存放N条要查询的数据
USE Gift163DBGOIF OBJECT_ID ( 'dbo.getRandomDataFromTable', 'P' ) IS NOT NULLDROP PROCEDURE dbo.getRandomDataFromTable;GOCREATE PROC [dbo].[getRandomDataFromTable]@tableName nvarchar(100),@dataCount nvarchar(100)ASBEGIN--SET NOCOUNT ON;
DECLARE @t TABLE (id INT) --临时表DECLARE @i INT --临时变量DECLARE @randomInt INT --每次随机生成的整数DECLARE @tableCount INT --表的行数--先获取表中最大数据的id
EXEC( 'SELECT '+@tableCount+'=COUNT(*) FROM '+@tableName+'')SET @i=0WHILE @i<@dataCountBEGINSELECT @randomInt=CEILING(RAND()*@tableCount)IF NOT EXISTS(SELECT TOP 1 * FROM @t)BEGININSERT INTO @t VALUES (@randomInt)SET @i=@i+1ENDEND--打印出取出的表的id
SELECT * FROM @tENDGo
生成测试数据100条
USE Gift163DBGOif exists (select 1from sysobjectswhere id = object_id('testable')and type = 'U')drop table testablegoCREATE TABLE testable(id INT IDENTITY(1,1),myname NVARCHAR(1000),insertedTime DATETIME DEFAULT SYSDATETIME())//插入100条数据DECLARE @i INTSET @i=1WHILE @i<100BEGININSERT INTO tesTable (myname) VALUES ('我的名字是'+CONVERT(NVARCHAR, @i) ) --将 varchar 值 '我的名字是' 转换成数据类型 int 时失败。SET @i=@i+1End
调用上面的存储过程从表testable取10条不重复id
USE Gift163DBgoexec getRandomDataFromTable 'testable',10
自定义的存储过程不会出现重复的记录
4.改进的存储过程,最终存储过程
输入参数3个:表名,表的递增列名 , 要取的N条数据
USE Gift163DBGOIF OBJECT_ID ( 'dbo.getRandomDataFromTable', 'P' ) IS NOT NULLDROP PROCEDURE dbo.getRandomDataFromTable;GOCREATE PROC [dbo].[getRandomDataFromTable]@tableName nvarchar(100),@identityKey NVARCHAR(100),@dataCount nvarchar(100)ASBEGIN--SET NOCOUNT ON;
--DECLARE @t TABLE (id INT) --临时表
DECLARE @i INT --临时变量DECLARE @randomInt INT --每次随机生成的整数DECLARE @tableCount INT --表的行数--先获取表中最大数据的id
DECLARE @str NVARCHAR(3000)SET @str='SELECT @tableCount=COUNT(*) FROM '+@tableNameexec sp_executesql @str, N'@tableCount int output', @tableCount outputcreate TABLE #sdf (id int)SET @i=0WHILE @i<@dataCount AND @i<@tableCountBEGINSELECT @randomInt=CEILING(RAND()*@tableCount)IF NOT EXISTS(SELECT TOP 1 * FROM #sdf WHERE id=@randomInt)BEGININSERT INTO #sdf VALUES (@randomInt)SET @i=@i+1ENDEND--取出数据
DECLARE @str2 NVARCHAR(2000)SET @str2=' SELECT * FROM '+@tableName+' where '+@identitykey
+' in '
+' (select id from #sdf )'
PRINT @str2--select id from @t
EXEC (@str2)--exec sp_executesql @str2,N'@t TABLE',@t OUTPUT
END
调用存储过程:随机取10条数据
最终的存储过程不管你随机取多少条数据(只要每次取的数据数目小于表中行数) 就可以保证每次取的数据不会重复。当然前提是,取的表必须有个递增列,而且以1开始,递增1.