DataSet.ReadXml() 能读取复杂 XML,但需符合 ADO.NET 隐式关系规则,否则易丢数据、建错表或抛异常;关键在于 XML 是否能映射为规范的 DataTable/DataRelation 结构,依赖明确的行元素、稳定嵌套层级与命名一致性。

DataSet.ReadXml() 能读取复杂 XML,但前提是 XML 结构符合 ADO.NET 的“隐式关系”规则,否则会丢数据、建错表,甚至抛异常。关键不是 XML 多“复杂”,而是它是否能映射成规范的 DataTable / DataRelation 层级结构。
XML 必须有明确的“行元素”和“嵌套层级”
ReadXml 默认按元素名推断表名,靠嵌套关系推断父子表。例如:
- 根元素下的直接子元素(如
)会被当成主表 - 主表元素内的子元素(如
)会被识别为子表,前提是子元素名是复数且内含同名单数项- ...
- 元素必须有稳定结构:同一层级下不能混用不同结构的同名元素(比如有的
有Price,有的没有,容易导致列缺失或类型冲突)
遇到命名不规范?先用 XmlReadMode 指定模式
默认行为(XmlReadMode.Auto)容易误判。更可控的做法是:
- 用
XmlReadMode.ReadSchema:要求 XML 内嵌 XSD,显式定义表结构和关系(最可靠) - 用
XmlReadMode.InferSchema:让 .NET 基于样本数据推断结构(适合测试,但首几条数据决定列类型,后续类型不一致会出错) - 避免
Auto——它可能把本该是属性的字段当元素,或忽略嵌套
深层嵌套/同名多层?手动预处理更稳
如果 XML 是类似 这种扁平嵌套,ReadXml 可能只生成一层表。这时建议:
- 用
XDocument或XmlDocument先提取关键片段,再分批 Load 到 DataSet 的不同 DataTable - 用
DataSet.ReadXmlSchema()单独加载 XSD,再用ReadXml(xmlStream, XmlReadMode.ReadSchema)保证结构对齐 - 对含属性+文本混合的节点(如
),ReadXml 默认忽略属性——需在 XSD 中声明99.99 xs:attribute并启用ReadSchema
验证结果:别只看 Tables.Count
读完后务必检查:
-
ds.Relations.Count是否等于预期的父子关系数 - 每个
DataTable.Columns是否包含所有字段(尤其注意大小写、空格、特殊字符是否被转义成 _x0020_) - 执行
ds.GetXmlSchema()看生成的 XSD 是否合理——这是调试隐式推断的最快方式
基本上就这些。复杂 XML 不一定难读,难的是让它“说人话”:结构清晰、命名一致、嵌套合理。必要时宁可多写几行预处理,也别赌 ReadXml 的自动推断。










