怎么用Python的BeautifulSoup库解析XML

煙雲

发布时间：2025-12-25 10:14:58

911人浏览过

来源于php中文网

原创

用BeautifulSoup解析XML需指定lxml-xml或xml解析器，不可用html.parser；推荐lxml因容错好，内置xml无需安装但易报错；注意编码匹配与命名空间限制。

怎么用python的beautifulsoup库解析xml

用 BeautifulSoup 解析 XML 和解析 HTML 类似，但关键在于指定正确的解析器——必须用支持 XML 的解析器，比如 lxml 或 xml（Python 内置的 xml.etree.ElementTree 封装），不能用默认的 html.parser（它只处理 HTML）。

安装依赖并选择合适的解析器

BeautifulSoup 本身不自带 XML 解析能力，需配合外部解析器：

推荐 lxml：功能强、速度快、对不规范 XML 容错好，需额外安装：pip install lxml
可用内置 xml：无需安装，但容错差，遇到声明缺失或编码问题容易报错，使用时传 "xml" 作为解析器名

基础解析示例（以 lxml 为例）

假设有如下 XML 字符串：

苹果5.2
香蕉3.8

代码解析方式：

立即学习“Python免费学习笔记（深入）”；

PicWish

推荐！专业的AI抠图修图，支持格式转化

下载

from bs4 import BeautifulSoup
xml_str = '''

苹果5.2
香蕉3.8
'''
soup = BeautifulSoup(xml_str, "lxml-xml")  # 注意：用 "lxml-xml" 而非 "lxml"
或者用内置解析器：soup = BeautifulSoup(xml_str, "xml")
for item in soup.find_all("item"):
name = item.find("name").text
price = float(item.find("price").text)
item_id = item.get("id")
print(f"ID: {item_id}, 名称: {name}, 价格: {price}")

注意几个常见坑

解析器名称要写对：用 lxml 时写 "lxml-xml"，不是 "lxml"（后者按 HTML 模式解析，会忽略 XML 声明和命名空间）
中文编码别出错：如果 XML 有，读文件时需用对应编码打开，再传给 BeautifulSoup；直接传字符串则确保是 Unicode（如 Python3 中的 str）
命名空间支持有限：BeautifulSoup 对带 namespace 的 XML 支持较弱，复杂场景建议改用 lxml.etree 原生接口

从文件读取 XML 并解析

推荐做法：

with open("data.xml", "r", encoding="utf-8") as f:
    soup = BeautifulSoup(f, "lxml-xml")
或者更稳妥地先读内容再解析（尤其编码不确定时）
with open("data.xml", "rb") as f:  # 二进制模式读
soup = BeautifulSoup(f, "lxml-xml")  # lxml-xml 可自动探测编码

基本上就这些。只要选对解析器、注意编码和命名空间限制，用 BeautifulSoup 解析常规 XML 很顺手。

Python怎么把XML转换成DataFrame Pandas读取XML教程

如何将数据库中的数据导出为XML格式，有哪些常见的方法？

Python如何使用cElementTree加速XML解析

Python xmltodict库怎么用 XML与字典轻松互转

Python的lxml.objectify怎么处理重复标签

相关标签:

python html 编码苹果 xml解析 Python html beautifulsoup pip 命名空间封装 xml 字符串接口 Namespace

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Kotlin怎么解析XML XmlPullParser教程下一篇：暂无

作者最新文章

什么是SOAP协议 SOAP消息的XML结构详解

2025-12-24 12:31

EF Core Column注解怎么用 EF Core指定列名方法

2025-12-24 12:49

Python怎么把XML转换成DataFrame Pandas读取XML教程

2025-12-24 12:50

发票查询怎么操作全国统一发票查询步骤图解

2025-12-24 12:52

.NET的DataSet.ReadXml()方法怎么读取复杂XML

2025-12-24 12:54

B站怎么上传视频哔哩哔哩UP主投稿详细流程【教程】

2025-12-24 13:25

.NET怎么与Python交互 Python.NET库使用教程

2025-12-24 13:51

币圈十大交易所app下载2025币圈交易所前十汇总

2025-12-24 13:53

谷歌浏览器打不开网页怎么办，提示“无法访问此网站”的解决方法

2025-12-24 14:02

C# Avalonia如何加密和解密配置文件 Avalonia数据安全

2025-12-24 14:07

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

707

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

625

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

734

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

616

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1234

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

573

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

695

2023.08.11