将十六进制文本转换为指定 JSON 格式的教程

DDD

发布时间：2025-09-04 18:45:46

695人浏览过

来源于php中文网

原创

将十六进制文本转换为指定 json 格式的教程

本文档旨在指导开发者如何使用 Python 将包含十六进制数据的文本文件转换为特定格式的 JSON 文件。该过程涉及读取文本文件，解析十六进制数据，将其转换为十进制，并最终以指定的 JSON 结构输出。通过本文，你将学习如何使用正则表达式提取数据，以及如何构建符合要求的 JSON 结构。

1. 理解输入数据格式

首先，我们需要理解输入的十六进制文本文件的格式。从示例数据来看，文件包含多个数据块，每个数据块的格式如下：

(ABC 01) Part: 1
00, 0a, 00, 0c

其中，(ABC 01) Part: 1 包含 ABC 编号、Part 编号（即 Section），以及实际的十六进制数据 00, 0a, 00, 0c。我们的目标是从这些数据块中提取信息，并将其转换为 JSON 格式。

2. 使用正则表达式解析文本

Python 的 re 模块非常适合用于解析这种结构化的文本数据。我们可以使用正则表达式来提取 ABC 编号、Section 编号和十六进制数据。

import json
import re

text = """
(ABC 01) Part: 1
00, 0a, 00, 0c

(ABC 01) Part: 2
02, fd, 01, 5e

(ABC 01) Part: 3

(ABC 05) Part: 4
00, 0a, 00, 0c
"""

pat_groups = r"^\((\S+) (\d+)\) Part: (\d+)\s*(.*?)(?=^\(|\Z)"
pat_hex = r"[\da-fA-F]+"

data = []
for name, n, section, group in re.findall(pat_groups, text, flags=re.S | re.M):
    data.append(
        {
            name: int(n),
            "Section": section,
            "Data": list(map(lambda i: int(i, 16), re.findall(pat_hex, group))),
        }
    )

json_string = json.dumps(data, indent=4)
print(json_string)

代码解释：

Artbreeder

创建令人惊叹的插画和艺术

下载

pat_groups = r"^$(\S+) (\d+)$ Part: (\d+)\s*(.*?)(?=^$|\Z)": 这个正则表达式用于匹配整个数据块。
- ^\(: 匹配行首的 ( 字符。
- (\S+): 匹配 ABC 标识符（非空白字符），并将其捕获到第一个分组。
- (\d+): 匹配 ABC 编号（数字），并将其捕获到第二个分组。
- $ Part:: 匹配 ) Part: 字符串。
- (\d+): 匹配 Section 编号（数字），并将其捕获到第三个分组。
- \s*: 匹配零个或多个空白字符。
- (.*?): 匹配数据部分（任意字符，非贪婪模式），并将其捕获到第四个分组。
- (?=^\(|\Z): 正向预查，确保匹配的数据块后面要么是另一个数据块的开始 (^\()，要么是字符串的结尾 (\Z)。
pat_hex = r"[\da-fA-F]+": 这个正则表达式用于匹配十六进制数据。
- [\da-fA-F]+: 匹配一个或多个十六进制字符（数字 0-9 和字母 a-f，不区分大小写）。
re.findall(pat_groups, text, flags=re.S | re.M): 使用 re.findall 函数查找所有匹配的数据块。re.S 标志使 . 可以匹配换行符，re.M 标志使 ^ 和 $ 可以匹配每行的开头和结尾。
list(map(lambda i: int(i, 16), re.findall(pat_hex, group))): 对于每个数据块，使用 re.findall 函数查找所有十六进制数据，并使用 map 函数将其转换为十进制整数。int(i, 16) 将十六进制字符串 i 转换为十进制整数。
json.dumps(data, indent=4): 将 Python 列表 data 转换为 JSON 字符串，并使用 indent=4 参数进行格式化，使其更易于阅读。

3. 代码优化与改进

上面的代码提供了一个基本框架，可以根据实际需求进行优化和改进。

文件读取： 可以将硬编码的字符串 text 替换为从文件中读取数据。
错误处理： 可以添加错误处理机制，例如，当无法将十六进制字符串转换为十进制整数时，记录错误信息。
数据验证： 可以添加数据验证步骤，例如，检查 ABC 编号和 Section 编号是否为有效值。

4. 完整示例代码

以下是一个完整的示例代码，演示了如何从文件中读取数据，并将其转换为 JSON 格式。

import json
import re

def hex_to_json(input_file, json_output_file):
    try:
        with open(input_file, 'r') as f:
            text = f.read()

        pat_groups = r"^\((\S+) (\d+)\) Part: (\d+)\s*(.*?)(?=^\(|\Z)"
        pat_hex = r"[\da-fA-F]+"

        data = []
        for name, n, section, group in re.findall(pat_groups, text, flags=re.S | re.M):
            try:
                hex_values = re.findall(pat_hex, group)
                decimal_values = [int(i, 16) for i in hex_values]
                data.append(
                    {
                        name: int(n),
                        "Section": section,
                        "Data": decimal_values,
                    }
                )
            except ValueError as e:
                print(f"Error converting hex to decimal: {e}")
                continue # Skip this entry if conversion fails

        with open(json_output_file, 'w') as outfile:
            json.dump(data, outfile, indent=4)

        print(f"Conversion complete. Output saved to {json_output_file}")

    except FileNotFoundError:
        print(f"Error: Input file '{input_file}' not found.")
    except Exception as e:
        print(f"An unexpected error occurred: {e}")


# Example usage
input_file = 'hex.txt'  # Replace with your input file name
json_output_file = 'output.json' # Replace with your desired output file name
hex_to_json(input_file, json_output_file)

注意事项：

确保输入文件存在，并且格式正确。
根据实际需求调整正则表达式，以匹配不同的数据格式。
添加适当的错误处理机制，以处理意外情况。
可以根据需要自定义 JSON 数据的结构。

5. 总结

本教程介绍了如何使用 Python 将包含十六进制数据的文本文件转换为特定格式的 JSON 文件。通过使用正则表达式解析文本数据，并将其转换为十进制整数，我们可以轻松地构建符合要求的 JSON 结构。希望本教程能够帮助你解决类似的问题。

Python 中 match-case 语句的条件匹配正确写法

如何用Python高效生成三个互不重复的随机ID

Python 3 中为内置类型启用字节串格式化：替代方案详解

Python 3 中实现字节串格式化：替代 %b 的标准方法

Python 3 中如何为内置类型生成字节串格式化结果

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

752

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

636

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

706

2023.08.11