0

0

PostgreSQL的xml_is_well_formed函数怎么用

月夜之吻

月夜之吻

发布时间:2025-12-27 12:47:04

|

511人浏览过

|

来源于php中文网

原创

xml_is_well_formed只接受text类型输入,用于快速校验XML字符串是否符合基础Well-Formed规则,不解析结构、不支持xml类型参数,也不做DTD/XSD验证。

postgresql的xml_is_well_formed函数怎么用

xml_is_well_formed 只接受 text 类型输入,不能直接传 XML 值

xml_is_well_formed 是 PostgreSQL 提供的纯文本校验函数,它不解析 XML 结构,也不做 DTD 或 Schema 验证,只检查字符串是否符合基础的 Well-Formed 规则(比如标签闭合、嵌套合法、字符转义正确等)。关键点是:它**只接受 text 参数,不接受 xml 类型值**。如果你传入一个已成功转换为 xml 类型的值(比如用 XMLPARSE 构造的),会报错:function xml_is_well_formed(xml) does not exist

  • ✅ 正确用法:xml_is_well_formed('ok')
  • ❌ 错误用法:xml_is_well_formed(XMLPARSE(CONTENT '...'))
  • ⚠️ 注意:即使字符串里有 BOM(如 UTF-8 BOM \xEF\xBB\xBF),也会导致返回 false

常见校验失败原因:空字符串、null、编码问题、非法字符

该函数对输入非常敏感,以下情况都会返回 false

  • 输入为 NULL → 返回 NULL(不是 false,注意三值逻辑)
  • 空字符串 '' → 返回 false
  • 含不可见控制字符(如 \x00\x01\x08\x0B\x0C\x0E\x1F)→ 返回 false
  • UTF-8 编码错误(如截断的多字节序列)→ 返回 false
  • XML 声明中指定了不支持的编码(如 encoding="ISO-8859-1" 但内容实际是 UTF-8)→ 返回 false

所以实际使用时建议先用 length()convert_from() 粗筛,再调用 xml_is_well_formed

和 XMLPARSE 的关系:校验 ≠ 解析,两者要配合用

xml_is_well_formed 快但浅,XMLPARSE 慢但深。前者适合在 INSERT/UPDATE 前快速过滤明显坏数据;后者才真正构建 XML 树并报详细错误(比如“mismatched tag”)。典型组合用法:

Android 基础知识入门 pdf版
Android 基础知识入门 pdf版

Android 基础知识入门 pdf,介绍什么是Android、Android可以完成的功能、Android架构、Android应用程序框架、Android函数库等,从开始安装Android开始,到环境配置,到一步步编写复杂的应用程序,本书将带你了解基础但有内涵的Android入门知识。

下载
SELECT 
  data,
  xml_is_well_formed(data) AS is_wf,
  CASE 
    WHEN xml_is_well_formed(data) THEN XMLPARSE(CONTENT data)
    ELSE NULL 
  END AS parsed_xml
FROM (VALUES 
  ('test'),
  ('unclosed'),
  ('')
) AS t(data);
  • xml_is_well_formed 能避免 XMLPARSE 因语法错误而中断整个查询
  • 但它无法发现语义错误(如重复 ID、非法命名空间前缀),这些仍需后续用 XPath 或 XSLT 处理
  • 性能上,xml_is_well_formedXMLPARSE 快 3–5 倍(实测千行随机 XML 字符串)

替代方案:需要 Schema 验证就得用外部工具或 plpythonu

PostgreSQL 内置不支持 DTD/XSD 验证。xml_is_well_formed 只管“形”,不管“义”。如果业务要求必须符合某 XSD:

  • plpythonu + lxml(需启用扩展并安装 Python 包)
  • 在应用层解析(推荐:更可控、易调试、可复用验证逻辑)
  • 导入前用 xmllint --schema schema.xsd --noout file.xml 预检(Shell 批处理场景)

别指望靠 xml_is_well_formed 拦住所有非法 XML —— 它连注释里的 嵌套错误都可能放过。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

708

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

625

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

736

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

616

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1234

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

573

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

695

2023.08.11

ip地址修改教程大全
ip地址修改教程大全

本专题整合了ip地址修改教程大全,阅读下面的文章自行寻找合适的解决教程。

27

2025.12.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.5万人学习

SciPy 教程
SciPy 教程

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号