mySQL的group by用法深入探讨

先上网上目前的结论:

  • 必須出現在where之後,order by之前
  • select中的列名必須是分組列或者列函數

但是,其实这个结论是不完整的。

先看表:

  1. Student table


    mySQL的group by用法深入探讨_第1张图片
  2. Apply table


    mySQL的group by用法深入探讨_第2张图片

现在,以下的group by是正确的:

select sname, count(distinct uName)
from Apply join Student using (sid)
group by (sid)
;

其实,其中sname换成sid, score, sssize都是对的
按理说按照最开始的结论,应该只有sid对才对的

而以下的是错误的:

select uName, count(distinct uName)
from Apply join Student using (sid)
group by (sid)
;

其实,uName换成degree、decision都是错的。

原因是:

结论还要加上:select中的列名不是分组列且不写在聚合函数里也是可以的,但是前提是该列名和分组列应该是一一对应关系

原理是:

首先要明确group by的每一个组在之后生成的查询结果表中肯定都是只占一行的。
所以先解释一下为什么聚合函数出现在select中肯定是没问题的:因为聚合函数生成的只有一个值,在生成表中只占用一格。
然后解释为什么上面的sname以及score以及sssize都可以,因为他们三个属性都和sid是一一对应关系(在Student表里面sid是主键,决定他们仨),所以他们仨在生成表里面也都只占用一格。
最后解释为什么degree那些要报错,因为他们在join之后的表里面和sid不是一一对应关系,因此在生成表里面就会占用多格,这就不符合atomic的标准了。

源于和舍友的讨论 <杨~叶>

你可能感兴趣的:(mySQL的group by用法深入探讨)