NULL是未知值标记,不参与比较运算,WHERE中需用IS NULL而非= NULL;索引通常不存NULL,影响查询性能;应优先设NOT NULL并用COALESCE等函数安全处理。

SQL中NULL值不是空字符串、零或布尔假,而是“未知值”的标记,它不参与常规比较运算,也不被普通索引完全覆盖——这是很多查询出错和性能问题的根源。
NULL在WHERE条件中的比较行为
任何与NULL的直接比较(= NULL、 NULL、> NULL等)结果都是UNKNOWN,而WHERE子句只保留TRUE行,因此这些条件永远不匹配。
- 写成
WHERE col = NULL→ 永远返回空结果,应改为WHERE col IS NULL - 写成
WHERE col != 'A'→ 会自动过滤掉col为NULL的行(因为NULL != 'A'是UNKNOWN),如需包含NULL,需显式加OR col IS NULL -
NOT IN (subquery)遇到子查询含NULL时整体返回空——因逻辑等价于对每个值做val != x1 AND val != x2 AND ...,一旦x为NULL,该子项为UNKNOWN,整行被排除
NULL与索引的关系
大多数主流数据库(如MySQL InnoDB、PostgreSQL、SQL Server)默认**不将纯NULL值存入B+树索引的叶子节点**(部分例外见下),这意味着:
- 单列索引上
WHERE col IS NULL可能走索引(取决于实现:PostgreSQL支持,MySQL 5.7+对IS NULL也优化;但WHERE col = NULL仍不走) - 复合索引(如
(a, b))中,若a为NULL,整条记录通常不进入索引(除非a定义为NOT NULL),导致WHERE a IS NULL AND b = 10很难利用该索引 - MySQL中,唯一索引允许**多个NULL值**(因NULL ≠ NULL,不违反唯一性),但PostgreSQL的唯一索引把所有NULL视为相等,只允许一个NULL
安全处理NULL的常用写法
避免逻辑漏洞和隐式类型转换,优先使用标准、显式的NULL处理函数:
-
COALESCE(col, 'default'):返回第一个非NULL表达式,推荐用于SELECT和JOIN条件(比ISNULL/IFNULL更跨平台) -
WHERE COALESCE(col, '') = ''替代模糊的WHERE col = '' OR col IS NULL(注意语义是否真等价) - JOIN时慎用NULL字段关联:
ON a.key = b.key会跳过任一端为NULL的行;如需匹配NULL,可写ON (a.key = b.key) OR (a.key IS NULL AND b.key IS NULL),但会显著影响性能 - 聚合函数(COUNT、SUM、AVG等)自动忽略NULL,无需额外过滤——这是少数对NULL“友好”的场景
建表与设计阶段的预防建议
从源头减少NULL带来的不确定性:
- 字段能设为NOT NULL,就尽量设(尤其主键、外键、业务强约束字段),配合DEFAULT值(如
created_at DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP) - 区分“未填写”和“不适用”:可用枚举或状态码代替NULL(例如status TINYINT NOT NULL DEFAULT 0,0=待提交,99=不适用)
- 如必须存NULL且高频查询,考虑冗余一列标志位(如
is_deleted BOOLEAN DEFAULT FALSE),比deleted_at DATETIME NULL更易索引和判断 - 在ORM或应用层统一约定:读取时用COALESCE兜底,写入前校验必要字段非NULL










