0

0

SQL数据库查询代价估算_优化器成本模型拆解

舞夢輝影

舞夢輝影

发布时间:2026-01-09 21:48:56

|

898人浏览过

|

来源于php中文网

原创

SQL查询代价估算基于I/O、CPU等资源折算的量化模型,由基础操作代价、统计信息驱动的规模估算和路径组合规则三部分构成,其准确性高度依赖统计信息的时效性与质量。

sql数据库查询代价估算_优化器成本模型拆解

SQL查询代价估算是数据库优化器做出执行计划选择的核心依据,不是凭经验猜测,而是基于一套可量化的成本模型进行计算。这个模型把I/O、CPU、内存、网络等资源消耗统一折算为“代价单位”,再比较不同执行路径的总代价,选出最小的那个。

代价模型的三大基础组件

现代关系型数据库(如PostgreSQL、SQL Server、Oracle)的成本模型通常由三部分构成:

  • 基础操作代价:单次扫描一页数据、比较一个字段、哈希一次键值等原子操作的预设开销。这些值通过基准测试校准,随硬件变化可调整。
  • 统计信息驱动的规模估算:利用表行数、列直方图、NULL比例、多列相关性等统计信息,估算WHERE条件过滤后剩余行数、JOIN结果集大小、GROUP BY分组数等——这是误差最大也最关键的环节。
  • 路径组合规则:定义嵌套循环JOIN、哈希JOIN、归并JOIN各自的代价公式;区分顺序扫描、索引扫描、索引仅扫描的I/O与CPU权重;考虑排序、物化、重分布等中间步骤的额外开销。

为什么估算常不准?统计信息是命门

代价估算偏差80%以上源于统计信息滞后或失真。例如:

  • 表刚批量插入100万新数据,但ANALYZE没运行,优化器仍按旧行数估算,可能放弃本该高效的索引扫描;
  • WHERE子句中两个高度相关的列(如country = 'CN' AND city = 'Shanghai')被当作独立事件估算,导致选择性高估,误判索引有效性;
  • 字符串前缀重复率高(如日志表中大量'ERROR: timeout'),直方图无法刻画分布尾部,导致LIKE 'ERROR%'谓词的过滤率严重误估。

看懂EXPLAIN输出里的Cost字段

以PostgreSQL为例,EXPLAIN (ANALYZE, COSTS ON)中每行的cost=100.00..2500.50 rows=1234 width=64含义是:

Runwayml(AI painting)
Runwayml(AI painting)

Runway 平台的文本生成图像AI工具

下载
  • 100.00:启动代价(start-up cost),即返回第一行前的预处理开销(如排序准备、索引定位);
  • 2500.50:总代价(total cost),包含启动代价+获取所有行的累计开销;
  • rows=1234:优化器预测该节点输出行数,直接影响下游JOIN或SORT的代价计算;
  • width=64:平均每行字节数,用于估算内存和网络传输成本。

注意:这些数值无绝对单位,只用于横向比较。实际执行时若Actual Rows远大于Rows,说明统计信息需更新或谓词建模有缺陷。

调优时真正该盯住的不是Cost数字,而是估算逻辑链

与其纠结“为什么这个计划cost是2500而不是2400”,不如逆向追踪:

  • 该节点的rows是怎么算出来的?查pg_stats确认对应列的n_distinct、most_common_vals是否合理;
  • 如果用了索引,index condition是否能被统计信息覆盖?检查是否存在表达式索引但未收集函数统计的情况;
  • JOIN顺序是否因某张小表的行数误估而错配?用SET enable_hashjoin = off临时禁用某类JOIN验证假设;
  • 是否触发了代价模型未充分建模的场景?如大结果集上的Window Function、JSONB深度遍历、全文检索rank计算——这些往往有隐式CPU惩罚但未显式计入cost。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

676

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

320

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

346

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1094

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

357

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

675

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

571

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

413

2024.04.29

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

3

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SQL 教程
SQL 教程

共61课时 | 3.4万人学习

Java 教程
Java 教程

共578课时 | 44.2万人学习

oracle知识库
oracle知识库

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号