700万数据随机取10条仅用不到10ms?

    set nocount on

    --75151448行数据
    select count(*) from syscolumns a,syscolumns b,syscolumns c
    set statistics time on

    select top 10 * from(
    select a.name as name,left(b.name,10) as name1, checksum(newid()) as hash
    from syscolumns a,syscolumns b,syscolumns c )t
    where hash%100=0

    set statistics time off
    set nocount off



SQL Server 执行时间:
  CPU 时间 = 16 毫秒,占用时间 = 4 毫秒。


这么bt?不过仔细一看是唬人的,这个是伪随机,后面数百万的大部分数据是一辈子都不会有机会显示的。但这是一个思路,where hash%100=0 这句话当中的100是个关键的因素。

要做到真的随机,至少需要hash%700000,同样的机器需要20秒,不过个人觉得已经很不错了。如果是hash%70000则是2秒,可以看出这基本是个线性关系。此思路应该比order by newid更加实用吧,order by newid()的top 10 我在运行了2分半还没有反应后放弃了。

你可能感兴趣的:(700万数据随机取10条仅用不到10ms?)