使用正则表达式解析并提取特定格式的字符串数据

花韻仙語

发布时间：2025-10-04 13:14:01

311人浏览过

来源于php中文网

原创

使用正则表达式解析并提取特定格式的字符串数据

本文将介绍如何使用 Python 的 re 模块，通过正则表达式从特定格式的字符串中提取数据，并将其转换成需要的键值对形式。

使用正则表达式解析字符串

假设我们有一个字符串，其中包含类似 55=id|1007=symbol 这样的模式，我们的目标是提取 symbol 和 id，并将它们转换成 symbol = id 的形式。

首先，我们需要导入 re 模块：

import re

然后，定义包含数据的字符串：

s = """55=22395|1007=BTCUSD|1008=3|55=22396|1007=BTCEUR|1008=2|55=22397|1007=ETHUSD|1008=3|55=22398|1007=ETHEUR|1008=3|55=20009|1007=TELENET GROUP|1008=2|55=20011|1007=MAGNEGAS CORP|1008=2|55=20012|1007=CALUMET SPEC PRDCTS|1008=2|55=20013|1007=CBOE HLDG INC|1008=2|55=20014|1007=ELECTRONIC ARTS INC|1008=2|55=20015|1007=EXPRESS SCRIPTS INC|1008=2|55=20016|1007=ADVANCE AUTO PARTS|1008=2|55=20017|1007=CHINA FUND INC|"""

接下来，使用 re.findall() 函数和正则表达式来提取数据。正则表达式 r"\b55=(\d+)\|\d+=([^|]+)" 的含义如下：

[置顶]Android中的JSON详细总结中文WORD版

JSON(JavaScript Object Notation) 定义：一种轻量级的数据交换格式，具有良好的可读和便于快速编写的特性。业内主流技术为其提供了完整的解决方案（有点类似于正则表达式，获得了当今大部分语言的支持），从而可以在不同平台间进行数据交换。JSON采用兼容性很高的文本格式，同时也具备类似于C语言体系的行为。有需要的朋友可以下载看看

下载

\b: 匹配单词边界，确保匹配的是完整的 55=。
55=: 匹配字符串 "55="。
(\d+): 匹配一个或多个数字，并将其捕获到第一个分组中（id）。
\|: 匹配字符 "|"。
\d+=: 匹配一个或多个数字后跟 "="。
([^|]+): 匹配除了 "|" 之外的一个或多个字符，并将其捕获到第二个分组中（symbol）。

for id_, symbol in re.findall(r"\b55=(\d+)\|\d+=([^|]+)", s):
    print(f"{symbol:<30} {id_}")

这段代码会遍历所有匹配项，并将 id 和 symbol 分别赋值给变量 id_ 和 symbol。然后，使用 f-string 打印结果，{symbol:

完整代码示例

import re

s = """55=22395|1007=BTCUSD|1008=3|55=22396|1007=BTCEUR|1008=2|55=22397|1007=ETHUSD|1008=3|55=22398|1007=ETHEUR|1008=3|55=20009|1007=TELENET GROUP|1008=2|55=20011|1007=MAGNEGAS CORP|1008=2|55=20012|1007=CALUMET SPEC PRDCTS|1008=2|55=20013|1007=CBOE HLDG INC|1008=2|55=20014|1007=ELECTRONIC ARTS INC|1008=2|55=20015|1007=EXPRESS SCRIPTS INC|1008=2|55=20016|1007=ADVANCE AUTO PARTS|1008=2|55=20017|1007=CHINA FUND INC|"""

for id_, symbol in re.findall(r"\b55=(\d+)\|\d+=([^|]+)", s):
    print(f"{symbol:<30} {id_}")

输出结果

运行上述代码，将会得到如下输出：

BTCUSD                         22395
BTCEUR                         22396
ETHUSD                         22397
ETHEUR                         22398
TELENET GROUP                  20009
MAGNEGAS CORP                  20011
CALUMET SPEC PRDCTS            20012
CBOE HLDG INC                  20013
ELECTRONIC ARTS INC            20014
EXPRESS SCRIPTS INC            20015
ADVANCE AUTO PARTS             20016
CHINA FUND INC                 20017

注意事项

正则表达式的编写需要根据实际的数据格式进行调整。
使用 re.findall() 函数返回的是一个列表，其中每个元素都是一个元组，包含所有捕获的分组。
可以使用 re.search() 函数来查找第一个匹配项。
可以使用 re.sub() 函数来替换字符串中的匹配项。

总结

通过本文的介绍，您学会了如何使用 Python 的 re 模块，通过正则表达式从特定格式的字符串中提取数据。这种方法在处理大量文本数据时非常有用，可以帮助您快速地提取所需的信息。掌握正则表达式的编写和使用，能够显著提高数据处理的效率。

如何在 Python 中递归展平嵌套的字典列表（含层级地址路径）

如何在 Python 中递归展平嵌套的字典列表

如何在 Python 中递归扁平化嵌套的对象列表

如何在 Python 中递归展平嵌套的字典列表（树形结构）

Python函数式编程教程_lambda与高阶函数应用解析

相关标签:

python 正则表达式键值对 btc Python 正则表达式 String 字符串 symbol

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python Socket数据传输：深度解析recv的陷阱与完整数据接收策略下一篇：使用 Pandas 计算 DataFrame 列的平均值并导出到 CSV

作者最新文章

1599元起！闪极发布首款多合一移动硬盘闪盘Pro：最高1000MB/s、自带拓展坞

2025-12-30 13:39

Angular 中使用条件类绑定实现多状态样式控制（在线/离线/故障）

2025-12-30 13:39

如何根据下拉选项动态显示或隐藏城市标签

2025-12-30 13:41

如何在 Django 模板中正确处理空列表并避免渲染异常？

2025-12-30 13:47

《寂静岭》制作人：目标是每年都发售一部《寂静岭》游戏

2025-12-30 13:50

明年发售？《刺客信条：代号女巫》创意总监称26年将公布大量内容

2025-12-30 13:55

Go 中自定义结构体的可读性格式化：实现 Stringer 接口实现优雅输出

2025-12-30 14:00

PHP 中 else 后误用条件表达式导致的语法错误解析与修复

2025-12-30 14:04

如何在 Bootstrap 折叠组件中单次点击即加载 NGL 3D 分子可视化

2025-12-30 14:04

R星前总监力挺拉瑞安：不做《博德之门4》值得尊重！

2025-12-30 14:07

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

716

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

626

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

739

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

699

2023.08.11