GROUP BY 是 SQL 中用于按指定列值将数据逻辑切分为多组并配合聚合函数统计的核心子句,其要求 SELECT 中非聚合字段必须全部出现在 GROUP BY 子句中,且 WHERE 在分组前过滤、HAVING 在分组后过滤。

SQL分组统计的核心是 GROUP BY,它把数据按一列或多列的相同值“归成一组”,再配合聚合函数(如 COUNT、SUM、AVG 等)对每组单独计算。没写 GROUP BY 却用了聚合函数,数据库会直接报错;写了 GROUP BY 却在 SELECT 中漏掉了分组字段或加了非聚合的其他字段,也会出错——这是初学者最常卡住的地方。
GROUP BY 是什么:不是排序,是“切分”
GROUP BY 不改变原始顺序,也不等同于 ORDER BY。它的作用是逻辑上把表“切成若干块”,每一块里指定字段的值完全一样。比如按部门分组,所有“技术部”的记录归为一组,“销售部”的归另一组,互不干扰。
- 只能对 GROUP BY 列或聚合结果做 SELECT,不能 SELECT 原始行里的其他普通字段(如姓名、订单号),除非它们也参与了分组
- WHERE 在分组前过滤行,HAVING 在分组后过滤组(所以 HAVING 可用聚合函数,WHERE 不可以)
- GROUP BY 后字段顺序不影响结果,但会影响结果集的排列顺序(部分数据库默认按 GROUP BY 字段顺序输出)
常用聚合函数怎么配:别只记名字,要懂行为
COUNT(*) 统计本组总行数(包括 NULL);COUNT(列名) 只统计该列非 NULL 的行数;SUM 和 AVG 会自动跳过 NULL;MAX/MIN 对字符串、日期、数字都有效,且忽略 NULL。
- 想查每个部门有多少人:SELECT dept, COUNT(*) FROM emp GROUP BY dept
- 想查每个产品类别的平均售价,且只显示平均价 > 100 的类别:SELECT category, AVG(price) FROM product GROUP BY category HAVING AVG(price) > 100
- 注意:SELECT 中所有非聚合字段必须出现在 GROUP BY 子句中(SQL 标准要求,MySQL 8.0+ 默认开启严格模式后同样遵守)
多字段分组和 NULL 的处理:细节决定成败
GROUP BY a, b 表示先按 a 分大组,再在每个 a 组内按 b 分小组。如果某字段含 NULL,数据库会把所有 NULL 视为“相同值”,单独归成一组(不是忽略,也不是报错)。
- 例如:GROUP BY region, city,当 region='华东' 且 city 为 NULL 的所有记录会归入同一组
- 若想把 NULL 当作一个特殊值参与统计,无需额外操作;若想排除 NULL 再分组,用 WHERE city IS NOT NULL 提前过滤
- 复合分组时,SELECT 列表可包含 a、b 和任何聚合结果,但不能出现 c(未分组也未聚合)
常见错误与绕不开的坑
很多报错看着像语法问题,其实是逻辑冲突。比如 “Expression not in GROUP BY” 就是因为 SELECT 里写了未聚合又未分组的字段;“Invalid use of group function” 往往是在 WHERE 里误用了 AVG 或 COUNT。
- ❌ 错误:SELECT name, COUNT(*) FROM student GROUP BY class(name 没分组也没聚合)
- ✅ 正确:SELECT class, COUNT(*) FROM student GROUP BY class,或 SELECT class, MAX(name), COUNT(*) FROM student GROUP BY class
- ❌ 错误:SELECT class FROM student WHERE COUNT(*) > 5 GROUP BY class(WHERE 不能用聚合)
- ✅ 正确:SELECT class FROM student GROUP BY class HAVING COUNT(*) > 5
基本上就这些。分组统计不复杂,但容易忽略规则背后的逻辑。理解“GROUP BY 定义了结果的维度,聚合函数定义了每个维度上的度量”,再结合 WHERE/HAVING 的执行时机,大部分问题都能自己推出来。










