XML解析报not well-formed错误主因是内容不合法:编码声明与实际不符、含非法字符或未转义符号、XML声明位置错误或含BOM。应检查响应头与XML声明一致性,用TextDecoder手动转码,清除BOM,转义特殊字符,并借助在线校验工具定位问题。

HTML5 中用 DOMParser 解析 XML 报 not well-formed 错误,基本可以断定是 XML 内容本身不合法,而不是浏览器或 API 有问题。
XML 字符编码与实际内容不匹配
最常见的原因是服务端返回的 XML 声明了编码(比如 ),但实际传输的内容是 GBK 或其他编码,或者 HTTP 响应头里的 Content-Type 声明了错误编码。
- 用浏览器开发者工具的 Network 面板查看响应原始内容(Raw 或 Preview),确认是否出现乱码或符号
- 检查响应头中的
Content-Type是否含charset=,且与 XML 声明一致;若不一致,优先以响应头为准(DOMParser会按响应头解析) - 如果后端无法修正,可在 JS 中先用
TextDecoder手动转码再解析:const decoder = new TextDecoder('gbk'); const decoded = decoder.decode(new Uint8Array(xhr.response)); const parser = new DOMParser(); const doc = parser.parseFromString(decoded, 'application/xml');
XML 内容含非法字符或未转义符号
XML 对字符集敏感,比如控制字符(U+0000–U+0008、U+000B–U+000C、U+000E–U+001F)、未闭合的 、未转义的 & 等,都会直接触发 not well-formed。
- 用正则粗筛常见问题:
/[^\x20-\xFF\x09\x0A\x0D\u0080-\uFFFF]/g可匹配大部分非法控制字符(注意:不能替代完整校验) -
&必须写成&,写成zuojiankuohaophpcn,否则解析失败 - 若 XML 来自用户输入或第三方接口,建议在解析前用
DOMParser先解析一段安全 wrapper,再提取文本内容做清洗,避免直接处理原始字符串
XML 声明位置错误或缺失换行
XML 声明 必须是文档第一行第一个字符,前面不能有任何空白、BOM 或隐藏字符。哪怕开头多一个 \uFEFF(UTF-8 BOM)也会报错。
立即学习“前端免费学习笔记(深入)”;
- 用
responseText.trimStart().startsWith(' 快速判断是否有前置不可见字符 - Node.js 或 Python 后端生成 XML 时,确保输出无 BOM;前端 fetch 后可用
text().then(t => t.replace(/^\uFEFF/, ''))清除 - 某些编辑器保存 XML 时默认加 BOM,改用 VS Code 并设置 “Save without BOM” 可规避
真正棘手的是那些看似合法、但因细微空格、换行、命名空间前缀不一致或 DTD 引用失效导致的解析失败——这时候别硬调,把原始 XML 复制进 https://www.xmlvalidation.com/ 这类在线校验器,比手动查快得多。










