将十六进制数据转换为特定JSON格式的教程

花韻仙語

发布时间：2025-09-04 19:06:13

557人浏览过

来源于php中文网

原创

将十六进制数据转换为特定json格式的教程

本文档旨在指导读者如何使用Python将包含十六进制数据的文本文件转换为特定格式的JSON文件。我们将使用正则表达式解析文本，并将十六进制值转换为十进制，最终生成符合要求的JSON结构。本教程提供详细的代码示例和解释，帮助读者理解转换过程并应用于实际场景。

1. 理解数据格式

首先，我们需要理解输入和输出的数据格式。

输入 (hex.txt):

(ABC 01) Part: 1
00, 0a, 00, 0c

(ABC 01) Part: 2
02, fd, 01, 5e

(ABC 01) Part: 3


(ABC 05) Part: 4
00, 0a, 00, 0c

期望输出 (decimalJSONFormat.json):

[
    {
        "ABC": 1,
        "Section": "1",
        "Data": [
            0,
            10,
            0,
            12
        ]
    },
    {
        "ABC": 1,
        "Section": "2",
        "Data": [
            2,
            253,
            1,
            94
        ]
    },
    {
        "ABC": 1,
        "Section": "3",
        "Data": []
    },
    {
        "ABC": 5,
        "Section": "4",
        "Data": [
            0,
            10,
            0,
            12
        ]
    }
]

可以看到，输入文件包含带分组信息的十六进制数据，我们需要将其转换为JSON数组，每个JSON对象包含 "ABC" (从分组名提取), "Section" 和 "Data" (十六进制转换为十进制后的数组) 字段。

2. 使用正则表达式解析文本

为了从输入文本中提取所需的信息，我们将使用 re 模块的正则表达式。

Timely

一款AI时间跟踪管理工具！

下载

import json
import re

text = """
(ABC 01) Part: 1
00, 0a, 00, 0c

(ABC 01) Part: 2
02, fd, 01, 5e

(ABC 01) Part: 3

(ABC 05) Part: 4
00, 0a, 00, 0c
"""

pat_groups = r"^\((\S+) (\d+)\) Part: (\d+)\s*(.*?)(?=^\(|\Z)"
pat_hex = r"[\da-fA-F]+"

data = []
for name, n, section, group in re.findall(pat_groups, text, flags=re.S | re.M):
    data.append(
        {
            name: int(n),
            "Section": section,
            "Data": list(map(lambda i: int(i, 16), re.findall(pat_hex, group))),
        }
    )

json_string = json.dumps(data, indent=4)
print(json_string)

代码解释:

import re: 导入正则表达式模块。
text: 包含示例数据的多行字符串。实际使用时，应该从文件中读取数据。
pat_groups = r"^$(\S+) (\d+)$ Part: (\d+)\s*(.*?)(?=^$|\Z)": 定义用于匹配分组信息的正则表达式。
- ^\(: 匹配行首的左括号。
- (\S+): 匹配 "ABC" 部分， \S+ 匹配一个或多个非空白字符。
- (\d+): 匹配分组编号，\d+ 匹配一个或多个数字。
- $ Part:: 匹配字面字符串 ") Part: "。
- (\d+): 匹配 Section 编号。
- \s*: 匹配零个或多个空白字符。
- (.*?): 匹配数据部分， . 匹配任意字符， *? 匹配零个或多个字符，非贪婪模式。
- (?=^\(|\Z): 正向肯定预查，确保匹配到下一个分组的开始 ^\( 或字符串的结尾 \Z。
pat_hex = r"[\da-fA-F]+": 定义用于匹配十六进制值的正则表达式。[\da-fA-F]+ 匹配一个或多个十六进制字符 (0-9, a-f, A-F)。
re.findall(pat_groups, text, flags=re.S | re.M): 使用 pat_groups 正则表达式在 text 中查找所有匹配项。
- re.S: 使 . 匹配包括换行符在内的所有字符。
- re.M: 使 ^ 和 $ 匹配每行的开头和结尾，而不仅仅是字符串的开头和结尾。
循环遍历匹配结果:
- name, n, section, group: 将每个匹配项解包为 name (ABC), n (分组编号), section (Section 编号) 和 group (数据)。
- data.append(...): 创建一个字典，包含 "ABC", "Section" 和 "Data" 字段。
  - name: int(n): 将分组编号转换为整数。
  - "Section": section: 使用匹配到的 Section 编号。
  - "Data": list(map(lambda i: int(i, 16), re.findall(pat_hex, group))): 使用 pat_hex 正则表达式在 group 中查找所有十六进制值，并将它们转换为十进制整数，最后转换为列表。
json.dumps(data, indent=4): 将 data 列表转换为 JSON 字符串，并使用 4 个空格进行缩进，以提高可读性。
print(json_string): 打印 JSON 字符串。

3. 从文件读取数据

上面的示例直接使用了字符串作为输入。为了从文件中读取数据，需要修改代码如下：

import json
import re

# 从文件读取数据
with open("hex.txt", "r") as f:
    text = f.read()

pat_groups = r"^\((\S+) (\d+)\) Part: (\d+)\s*(.*?)(?=^\(|\Z)"
pat_hex = r"[\da-fA-F]+"

data = []
for name, n, section, group in re.findall(pat_groups, text, flags=re.S | re.M):
    data.append(
        {
            name: int(n),
            "Section": section,
            "Data": list(map(lambda i: int(i, 16), re.findall(pat_hex, group))),
        }
    )

# 将数据写入 JSON 文件
with open("decimalJSONFormat.json", "w") as f:
    json.dump(data, f, indent=4)

print("Conversion complete. Output saved to decimalJSONFormat.json")

修改说明:

使用 with open("hex.txt", "r") as f: 打开 hex.txt 文件，并读取所有内容到 text 变量。
使用 with open("decimalJSONFormat.json", "w") as f: 打开 decimalJSONFormat.json 文件，并将 JSON 数据写入该文件。

4. 注意事项

错误处理: 在实际应用中，应该添加错误处理机制，例如处理文件不存在、文件格式错误等情况。
正则表达式优化: 可以根据实际数据格式优化正则表达式，以提高匹配效率。
数据验证: 在将十六进制值转换为十进制时，可以添加数据验证，确保输入的十六进制值是有效的。
JSON 编码: 确保使用正确的 JSON 编码处理特殊字符。

5. 总结

本教程详细介绍了如何使用 Python 将包含十六进制数据的文本文件转换为特定格式的 JSON 文件。通过使用正则表达式解析文本，并将十六进制值转换为十进制，最终生成符合要求的JSON结构。希望本教程能够帮助读者理解转换过程并应用于实际场景。

使用 GCP Asset API 检索 Compute 实例的正确方法

如何使用 Python 解析并逐项验证逻辑表达式

如何计算相邻行（按分组标识）的平均值

如何使用列表动态生成 PostgreSQL 表结构 SQL 语句

Python调试时断点导致行为差异的真相揭秘

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

751

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

635

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

706

2023.08.11