Python接口参数校验需在请求入口嵌入多层约束,覆盖类型、范围、格式及业务规则,使用框架声明式校验(如FastAPI的Pydantic、DRF的Serializer),敏感字段仅做基础格式验证并脱敏,避免副作用、信息泄露与数据库查询。

Python接口参数校验是保障数据安全的第一道防线,核心在于“提前拦截非法输入”,而非依赖后端逻辑兜底。校验不等于简单判断非空,需覆盖类型、范围、格式、业务规则等多层约束,同时避免暴露敏感信息或引发安全风险。
校验要嵌入请求入口,别等进业务逻辑再处理
使用框架(如FastAPI、Flask-RESTful、Django REST Framework)的声明式校验机制,把校验逻辑放在路由层或序列化层,而不是在视图函数里手写if判断。这样既统一管理,又防止遗漏。
- FastAPI:直接用Pydantic模型定义字段类型、默认值、约束(min_length=1, max_length=50, ge=0, le=100, regex=r'^[a-zA-Z0-9_]+$')
- Django REST Framework:用Serializer的validators和field-level validation方法,避免在view中重复校验
- 自定义装饰器(如Flask):可封装通用校验逻辑,但需确保错误响应统一返回400及明确的错误字段提示,不泄露内部结构
敏感字段必须脱敏校验,禁止明文参与规则判断
密码、身份证号、手机号等字段,校验重点不是“内容是否合法”,而是“是否符合基本格式+长度+是否已哈希/加密”。切勿在校验阶段解密或正则匹配明文敏感内容。
- 手机号:用re.match(r'^1[3-9]\d{9}$', phone)校验格式即可,不查归属地、不调第三方接口
- 密码:只校验长度(如8–64位)、是否含大小写字母/数字/符号(可选),绝不校验明文强度(如是否含生日)
- 身份证号:仅做基础格式(15/18位、末位校验码)验证,不解析出生日期或地区码用于业务逻辑
避免校验引发副作用或信息泄露
校验过程本身不能改变数据状态,也不能返回过于具体的错误原因,防止被用于探测系统细节。
立即学习“Python免费学习笔记(深入)”;
- 不要返回“用户名已存在”和“邮箱已注册”两种不同提示——统一为“该账户已被注册”
- 不要因校验失败触发日志记录完整参数(尤其含token、密钥),应脱敏后记录,如"api/login: user='u_****' failed validation"
- 避免在参数校验中调用数据库查询(如“检查用户名是否唯一”)——这类应归入业务层,并加缓存与限流
配合输入规范化,减少校验盲区
校验前先做标准化处理,能显著提升鲁棒性。比如去除首尾空格、统一编码、转义特殊字符(但注意:HTML转义应在渲染层,不在校验层)。
- 字符串字段:自动strip(),再校验长度;对富文本字段,限制HTML标签白名单而非简单过滤script
- 数值字段:int/float转换失败时抛出ValidationError,不静默转0或None
- 时间字段:统一接收ISO格式(如2024-01-01T12:00:00Z),拒绝时间戳或中文日期字符串










