SQL执行计划中Filter、Projection、Join是三大核心算子:Filter按条件筛行,影响索引下推;Projection裁剪输出列,决定IO与内存开销;Join实现多表关联,含Nested Loop、Hash、Sort-Merge三种策略。

SQL执行计划中的算子,是数据库引擎实际执行查询时的底层操作单元。理解过滤(Filter)、投影(Projection)、连接(Join)这三类核心算子,能帮你快速定位慢查询瓶颈、读懂执行计划、写出更高效的SQL。
过滤(Filter):WHERE和HAVING背后的“筛子”
Filter算子负责按条件筛选行,对应SQL中的WHERE(作用于单表或连接前)和HAVING(作用于分组后)。它不改变列结构,只减少行数。
- 索引是否生效,关键看Filter是否能下推到存储层——比如
WHERE create_time > '2024-01-01'若字段有索引,通常会转为Index Range Scan,而非全表扫描后Filter - 写WHERE时避免在字段上用函数或表达式,如
WHERE YEAR(create_time) = 2024会让Filter无法利用索引,变成全表扫描+计算过滤 - HAVING过滤发生在GROUP BY之后,开销通常比WHERE大;能用WHERE提前过滤的,别拖到HAVING
投影(Projection):SELECT列表决定的“列裁剪”
Projection算子负责输出指定列(包括计算列、别名、常量),它不筛选行,但影响数据传输量和内存占用。
-
SELECT *会触发全列Projection,即使业务只用其中2列,也会把所有字段从磁盘读出、网络传回,浪费IO和带宽 - 聚合查询中,Projection还包含GROUP BY字段和聚合函数结果,如
SELECT dept, COUNT(*) FROM emp GROUP BY dept,Projection需保留dept值并构造count列 - 某些优化器会在Projection阶段做常量折叠(如
SELECT 1+1 AS c直接算成2)或表达式简化,减少后续计算
连接(Join):多表关联的三种典型实现
Join算子把多个表按关联条件组合成新行集,主流实现方式有Nested Loop Join、Hash Join、Sort-Merge Join,选择取决于数据量、分布、索引和统计信息。
- Nested Loop:适合小表驱动大表,外层每行去内层查匹配行;若内表关联字段无索引,性能急剧下降
-
Hash Join:先对小表建哈希表,再扫描大表探测匹配;要求内存足够,且一般要求等值连接(
=),不支持或范围条件 - Sort-Merge:两表先按连接键排序,再归并匹配;适合已排序数据或大表间等值/范围连接,但排序开销高
- 注意连接顺序:优化器通常选行数少、过滤强的表作驱动表;手动调优可用
STRAIGHT_JOIN(MySQL)或LEADING(Oracle)干预
这三个算子不是孤立运行的,而是嵌套组合:比如一个JOIN后面接FILTER再接PROJECTION,执行计划树里它们层层包裹。看懂它们各自的输入输出、代价来源和依赖条件,比死记“走索引”“用Hash”更有实际价值。










