XML解析必须用DOMParser而非JSON.parse,它将字符串转为Document对象;需注意浏览器兼容性、XML声明自动忽略、失败时检查documentElement是否为null;手动转JSON时应按语义映射:无子元素无属性→纯文本,有子元素→对象且同名兄弟节点强制为数组,属性统一存入@attributes。

XML 字符串解析必须用 DOMParser,不能用 JSON.parse
浏览器原生不支持直接把 XML 当 JSON 解析,JSON.parse() 会立刻报 SyntaxError: Unexpected token 。正确入口是 DOMParser —— 它能把 XML 字符串转成可遍历的 Document 对象。
注意点:
-
DOMParser在 IE10+ 和所有现代浏览器可用,但 Node.js 环境不内置(需用xml2js或fast-xml-parser) - 如果 XML 带 XML 声明(如
),DOMParser能自动忽略,无需提前正则剔除 - 解析失败时返回空文档且无异常,要手动检查
parser.parseFromString(xmlStr, "text/xml").documentElement === null
递归遍历 Element 的三个核心规则
手动转 JSON 的难点不在解析,而在如何合理映射 XML 结构到 JS 对象。关键不是“全转成对象”,而是按语义区分:
- 只有 0 个子元素 + 无属性 → 当作纯文本值(字符串或数字,可选自动类型转换)
- 有子元素 → 当作对象,子元素名作 key;若同名兄弟节点多个(如多个
),必须转为数组 - 属性统一收进
@attributes字段(或其他约定前缀),避免和子元素名冲突
示例 XML 片段:
立即学习“前端免费学习笔记(深入)”;
Alice js html
对应 JSON 应类似:
{
"root": {
"@attributes": { "id": "123" },
"name": "Alice",
"tags": {
"tag": ["js", "html"]
}
}
}
处理文本节点和空白字符的坑
XML 中换行、缩进、空格在 DOM 中会生成 Text 节点,容易误判为有效内容。比如:
Alice
实际产生 3 个子节点:换行文本 + name 元素 + 换行文本。直接取 childNodes[0].textContent 会得到 "\n Alice\n"。
安全做法:
- 只对
nodeType === 1(即Element)递归处理 - 提取文本值时,用
Array.from(el.childNodes)过滤出nodeType === 3(Text)节点,再.map(n => n.textContent.trim()).filter(Boolean) - 若某元素既有子元素又有文本(混合内容),需保留
#text字段,否则信息丢失
不推荐 deepMerge 多层同名节点,优先用数组包裹
常见错误是遇到多个同名子元素(如 5 个 )时,试图逐个 Object.assign 合并,结果后一个覆盖前一个。
正确策略只有一条:
- 只要父元素下存在两个及以上同名
Element子节点,该字段值强制为数组 - 即使只有一个,也建议统一为数组(保持结构可预测),或加开关参数控制(
{ alwaysArray: ["item", "entry"] }) - 不要尝试“智能判断是否该是数组”——XML Schema 不保证重复性,运行时数据才决定
这意味着你得先遍历一遍子节点,统计同名 Element 出现次数,再决定字段类型。这是手动实现绕不开的两趟遍历。
复杂点往往不在语法,而在于要不要保留注释、CDATA、命名空间、处理指令这些 XML 特有节点——绝大多数业务场景应直接跳过它们,只处理 nodeType === 1。










