Python如何将XML的解析结果缓存起来

畫卷琴夢

发布时间：2026-01-03 09:57:02

692人浏览过

来源于php中文网

原创

Python中XML解析结果缓存的核心思路是避免重复解析，将解析后的Element对象转为可序列化形式或用支持对象缓存的机制（如lru_cache、joblib、Redis）存储复用。

python如何将xml的解析结果缓存起来

Python中将XML解析结果缓存起来，核心思路是：**避免重复解析同一份XML文件或字符串，把解析后的结构（如ElementTree.Element对象）存起来复用**。由于Element对象不可直接序列化（比如用pickle），需转换为可缓存的形式，或使用支持对象缓存的机制。

用lru_cache缓存解析函数（适合小量、固定XML源）

如果XML内容来自文件路径或稳定字符串，且解析开销大、调用频繁，可用@lru_cache装饰器缓存结果。注意：必须确保输入参数可哈希（如用文件路径字符串，而非打开的file对象）。

对文件路径缓存（推荐）：

```python from xml.etree import ElementTree as ET from functools import lru_cache

@lru_cache(maxsize=128) def parse_xml_from_file(filepath): tree = ET.parse(filepath) return tree.getroot() # 或返回整个tree

后续多次调用相同路径会直接返回缓存的root元素

root1 = parse_xml_from_file("config.xml") root2 = parse_xml_from_file("config.xml") # 不重新解析


  若输入是XML字符串，需确保字符串本身可哈希（通常可以），但注意长字符串可能占用较多缓存空间；也可先计算其hash（如hashlib.md5(text.encode()).hexdigest()）作为键，再缓存。


序列化为字典+JSON缓存（跨进程/持久化友好）
将Element转为嵌套字典后，用JSON保存到磁盘或内存缓存（如redis），适合需要共享、重启不丢失或分布式场景。

  简单递归转字典（忽略命名空间、属性较简）：

```python
import json
from xml.etree import ElementTree as ET

def element_to_dict(element):
    result = {"tag": element.tag, "text": element.text.strip() if element.text else ""}
    if element.attrib:
        result["attrib"] = element.attrib
    children = list(element)
    if children:
        result["children"] = [element_to_dict(child) for child in children]
    return result

# 解析并缓存为JSON
tree = ET.parse("data.xml")
root = tree.getroot()
cache_key = "data.xml"
cached_json = json.dumps(element_to_dict(root))

# 存入文件或redis
with open(f"{cache_key}.json", "w") as f:
    f.write(cached_json)

# 后续读取时反序列化（需自行重建Element或直接用字典）
```

用shelve或joblib做本地对象级缓存（保留ElementTree结构）
shelve和joblib支持部分Python对象的持久化。虽然Element本身不能直接pickle，但ET.ElementTree实例在多数情况下可被joblib安全序列化（实测兼容性较好）。

							
								
								
									MedPeer
									AI驱动的一站式科研服务平台
								
								下载 
							
						
立即学习“Python免费学习笔记（深入）”；

  用joblib缓存整个tree（推荐，简洁可靠）：

```python
import joblib
from xml.etree import ElementTree as ET

def get_cached_tree(filepath, cache_dir="xml_cache"):
    import os
    os.makedirs(cache_dir, exist_ok=True)
    cache_path = os.path.join(cache_dir, f"{hash(filepath)}.joblib")

    if os.path.exists(cache_path):
        return joblib.load(cache_path)

    tree = ET.parse(filepath)
    joblib.dump(tree, cache_path)
    return tree

# 使用
tree = get_cached_tree("settings.xml")
root = tree.getroot()
```

用Redis缓存（适合多进程/微服务）
将XML字符串或序列化后的字典存入Redis，键为文件名或内容hash，值为XML文本或JSON。解析动作仍发生于每次读取后，但省去了磁盘IO。

  示例（缓存原始XML字符串，避免重复读文件）：

```python
import redis
import hashlib
from xml.etree import ElementTree as ET

r = redis.Redis()

def parse_xml_cached(xml_content):
    key = "xml:" + hashlib.md5(xml_content.encode()).hexdigest()
    cached = r.get(key)
    if cached is not None:
        return ET.fromstring(cached)

    root = ET.fromstring(xml_content)
    r.setex(key, 3600, xml_content)  # 缓存1小时
    return root
```
注意：若缓存解析后的结构，需先转成可序列化格式（如字典+JSON），再存Redis。

Python怎么将CSV数据转换为XML格式

Python lxml的fromstring和parse有什么不同

Python如何将XML转换为字典列表

PowerPoint的PPTX文件XML内容怎么分析

如何从URL读取XML数据 Python请求并解析XML

相关标签:

python redis js json xml解析 red Python xml 字符串对象 redis

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：LibreOffice Calc怎么打开和编辑XML表格下一篇：暂无

作者最新文章

为什么写小说赚不到钱新手写网文最容易犯的3个错误【复盘】

2025-12-31 15:19

三角洲全球官网入口三角洲行动海外版官方网址

2025-12-31 15:22

小红书网页版官方入口电脑版在线免下载使用

2025-12-31 15:42

Word字间距怎么调整距怎么调_Word字间距与段落间距区别调整

2025-12-31 15:58

死神vs火影网页版直接玩免下载一键启动入口

2025-12-31 16:43

MC.JS在线游戏平台畅玩版永久免费入口

2025-12-31 16:45

打开即玩MC.JS电脑版官方推荐稳定入口

2025-12-31 16:46

B站PC端官网入口哔哩哔哩电脑版官方入口

2025-12-31 16:57

学习通网页版官方入口_超星平台在线课程学习中心

2025-12-31 17:02

小红书网页版入口在哪里小红书电脑网页版登录指南【教程】

2025-12-31 17:21

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

727

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

630

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

747

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

702

2023.08.11