GROUP BY分组排序获取topN相关

MySQL VERSION : 5.5.45
ENGINE    : InnoDB

问题描述:
    获取成绩表中每位同学成绩排名前n的记录。

表结构:
GROUP BY分组排序获取topN相关_第1张图片

表数据:
GROUP BY分组排序获取topN相关_第2张图片

法一(用户变量):
①首先我先得到每组排名的所有结果

点击(此处)折叠或打开

  1. select @gp_row:=if(@name=name,@gp_row+1,1) as gp_row,@name:=name,id,name,grade from td ,(select @gp_row:=0,@name:='') as temp order by name,grade desc;
得到如下结果:
GROUP BY分组排序获取topN相关_第3张图片

②在把该结果作为中间表,查询top N的数据

点击(此处)折叠或打开

  1. select id ,name ,grade from (select @gp_row:=if(@name=name,@gp_row+1,1) as gp_row,@name:=name,id,name,grade from td ,(select @gp_row:=0,@name:='') as temp order by name,grade desc) as tb_gp_rank where gp_row<=2;
得到结果如下:
GROUP BY分组排序获取topN相关_第4张图片

③查看执行计划
GROUP BY分组排序获取topN相关_第5张图片
我们可以看到,对td使用了一个全表扫面(和索引字段相关和select,where字段相关等),并且用到了using filesort,当表记录数过多的时候效率肯定不高,这也没办法,数据无序以及没有相关索引以及select字段还有一些关系,但是这种查询方式基本可以满足这一类型的基本需求。

法二(union):
①在知道分组字段的情况下,可以使用union合并各组结果集

点击(此处)折叠或打开

  1. (select id ,name ,grade from td where name='tab' order by grade desc limit 2) union (select id ,name ,grade from td where name='lily' order by grade desc limit 2);
GROUP BY分组排序获取topN相关_第6张图片

②查看执行计划
GROUP BY分组排序获取topN相关_第7张图片
可以发现,在此种表结构下,union操作会扫n次全表(和索引字段相关),即多少个union结果集就有多少次。这种方法还需知道需要分组排序的具体的字段值,使用上有限制。

法三(子查询):
①子查询的方式适合选择并列top N的情况

点击(此处)折叠或打开

  1. select a.* from td a where (select count(*) from td where td.name=a.name and td.grade>a.grade)<2 order by name,grade desc;
GROUP BY分组排序获取topN相关_第8张图片
此时在插入一条数据 insert into td select null,'tab',76;
再次查询可得结果如下
GROUP BY分组排序获取topN相关_第9张图片
也就是说在排序之后最后一条数据如果有重复的则都会作为结果集返回,即第一次查询的结果,tab 成绩为44位于第二名的数据有两条。

法四(join连接):即把子查询转换为join连接,这里就不在测试。


总结:最后关于这个方法该如何选择得结合业务以及表结构以及需求具体分析,可用explain,profile等工具。


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31385648/viewspace-2128334/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/31385648/viewspace-2128334/

你可能感兴趣的:(GROUP BY分组排序获取topN相关)