推荐使用xml.etree.ElementTree或lxml生成复杂XML嵌套结构,避免手动拼接;ElementTree适合多数场景,通过SubElement逐级构建并设属性与文本;lxml支持命名空间和自动缩进;字典递归法可实现数据驱动的动态生成。

用Python生成复杂的XML嵌套结构,核心是选对工具、理清层级逻辑、避免手动拼接字符串。推荐使用 xml.etree.ElementTree(标准库,轻量可靠)或 lxml(功能更强,支持XPath、命名空间、漂亮打印等)。手动字符串拼接容易出错,不推荐用于复杂嵌套。
用 ElementTree 构建多层嵌套
ElementTree 适合大多数场景。关键思路是:从根节点开始,逐级创建子元素,用 append() 或 SubElement() 添加子节点,用 set() 设置属性,用赋值方式设置文本内容。
- 用
ET.Element()创建根节点 - 用
ET.SubElement(parent, tag, attrib={})快速添加带属性的子节点 - 子元素可继续调用
SubElement实现深度嵌套 - 文本内容直接赋值给
.text,尾部空白用.tail(较少用)
示例:生成含客户、订单、多个商品的结构
import xml.etree.ElementTree as ETroot = ET.Element("business") client = ET.SubElement(root, "client", id="C1001") client.set("type", "premium")
order = ET.SubElement(client, "order", order_id="ORD-789") ET.SubElement(order, "date").text = "2024-06-15" items = ET.SubElement(order, "items")
item1 = ET.SubElement(items, "item", sku="SKU-001") ET.SubElement(item1, "name").text = "Laptop" ET.SubElement(item1, "qty").text = "1"
item2 = ET.SubElement(items, "item", sku="SKU-002") ET.SubElement(item2, "name").text = "Mouse" ET.SubElement(item2, "qty").text = "3"
tree = ET.ElementTree(root) tree.write("output.xml", encoding="utf-8", xml_declaration=True)
用 lxml 处理命名空间与自动缩进
当XML需严格遵循命名空间(如 SOAP、Atom),或需要可读性高的格式化输出时,lxml 更合适。它原生支持 pretty_print=True 和命名空间声明。
立即学习“Python免费学习笔记(深入)”;
- 安装:
pip install lxml - 用
{namespace}tag语法声明带命名空间的标签 -
etree.tostring(..., pretty_print=True, encoding="unicode")直接获得缩进良好的字符串 - 支持
etree.Comment、etree.PI等高级节点类型
示例:带命名空间的配置文件片段
from lxml import etreeNS = {"cfg": "https://www.php.cn/link/98a5ad54e01fee0f3a9b88257b81c878"}
root = etree.Element("{https://www.php.cn/link/98a5ad54e01fee0f3a9b88257b81c878}config") server = etree.SubElement(root, "{https://www.php.cn/link/98a5ad54e01fee0f3a9b88257b81c878}server") etree.SubElement(server, "{https://www.php.cn/link/98a5ad54e01fee0f3a9b88257b81c878}host").text = "api.example.com" etree.SubElement(server, "{https://www.php.cn/link/98a5ad54e01fee0f3a9b88257b81c878}port").text = "443"
自动缩进输出
print(etree.tostring(root, pretty_print=True, encoding="unicode"))
用字典+递归函数动态生成 XML
若嵌套结构来自配置或用户输入(如 JSON/YAML 转 XML),可写一个通用转换函数。规则:字典键为标签名,值为字符串(设为 .text)、字典(递归为子节点)或列表(多个同名子节点)。
- 处理字符串 → 设
.text - 处理字典 → 递归创建子元素,支持内嵌
@attr键定义属性 - 处理列表 → 对每个元素调用递归,生成多个同名节点
- 跳过
None值,忽略非法键(如以@开头但非属性)
这种模式让数据驱动结构更清晰,适合模板化生成。
注意事项与避坑点
生成复杂 XML 时容易踩的几个坑:
- 中文或特殊字符未声明 UTF-8 编码 → 写入时加
encoding="utf-8"和xml_declaration=True - 标签名含非法字符(空格、冒号未配命名空间)→ 提前校验或用
xml.sax.saxutils.escape()转义内容,而非标签名 - 深层嵌套导致可读性差 → 先构建子树再挂载,比如先做
items_elem = build_items_list(items_data),再order.append(items_elem) - 属性值含引号或尖括号 → ElementTree 会自动转义,无需手动处理
不复杂但容易忽略。










