0

0

处理特定JSON格式关键点数据的姿态估计算法与实践

聖光之護

聖光之護

发布时间:2025-11-24 12:26:01

|

221人浏览过

|

来源于php中文网

原创

处理特定JSON格式关键点数据的姿态估计算法与实践

在姿态估计领域,直接找到一个模型能精确输出特定json格式的关键点数据是较为罕见的。本教程旨在指导用户如何选择合适的姿态估计算法,理解其输出格式,并重点讲解如何通过python代码将模型的标准输出转换为用户所需的特定json结构,以实现数据格式的无缝对接和高效利用。

姿态估计是计算机视觉中的一个重要任务,旨在识别图像或视频中人体关键点的位置。尽管存在多种先进的姿态估计算法,但它们通常会输出各自预设格式的关键点数据。当用户需要将模型输出整合到现有系统或特定应用中时,数据格式的匹配便成为一个常见挑战。本教程将探讨如何应对这一挑战,特别是针对用户提供的JSON格式。

姿态估计算法概述与输出格式理解

当前主流的姿态估计算法大致可分为自上而下(Top-Down)和自下而上(Bottom-Up)两类。

  • 自上而下方法:首先检测图像中的所有人形目标,然后对每个检测到的人形框进行关键点估计。代表模型有Mask R-CNN、AlphaPose、YOLOv8-pose等。
  • 自下而上方法:首先检测图像中的所有关键点,然后将这些关键点聚合成不同的人体实例。代表模型有OpenPose、HRNet等。

无论采用哪种方法,模型的输出通常包含以下信息:

  1. 关键点坐标:每个关键点的(x, y)像素坐标。
  2. 置信度分数:表示模型对每个关键点检测结果的信心程度。
  3. 人体实例ID:当图像中存在多个人时,用于区分不同人的关键点集合。

这些信息通常以列表、数组或字典的形式组织,并可能遵循COCO、MPII等标准数据集的格式约定。用户提供的JSON格式中,pose_keypoints是一个扁平化的列表,以[x1, y1, c1, x2, y2, c2, ...]的形式存储,其中c代表置信度。这种格式是许多模型(如OpenPose)的常见输出方式,但其外部包裹的{"version": 1.0, "people": [...]}结构以及face_keypoints、hand_right_keypoints、hand_left_keypoints等字段的空列表,则体现了特定的定制化需求。

数据格式转换策略

鉴于直接找到一个能完全符合特定JSON输出结构的模型难度较大,最实用的方法是:

  1. 选择一个高性能的姿态估计算法。
  2. 运行模型获取其标准输出。
  3. 编写脚本将模型的标准输出转换为目标JSON格式。

这个策略的核心在于第三步,即数据转换。

1. 选择合适的姿态估计模型

选择模型时,应考虑以下因素:

Moshi Chat
Moshi Chat

法国AI实验室Kyutai推出的端到端实时多模态AI语音模型,具备听、说、看的能力,不仅可以实时收听,还能进行自然对话。

下载
  • 性能:准确性和速度是否满足项目需求。
  • 易用性:是否有完善的文档、预训练模型和易于集成的API(如Python库)。
  • 社区支持:活跃的社区能提供更好的问题解决和更新。

例如,Ultralytics的YOLOv8-pose是一个不错的选择,它提供了易于使用的Python API和预训练模型,并且其文档中详细介绍了如何处理姿态估计的输入输出。OpenPose也是一个强大的选择,其输出格式与用户提供的pose_keypoints部分非常相似。

2. 理解模型的输出格式

以YOLOv8-pose为例,其推理结果通常会包含每个检测到的人的关键点信息,可能是一个Keypoints对象,其中包含xyc(坐标和置信度)属性。这些数据通常以NumPy数组或PyTorch张量的形式呈现。

假设一个模型(例如经过处理的OpenPose或YOLOv8-pose结果)为图像中的每个人返回一个包含17个关键点的列表,每个关键点由[x, y, confidence]组成。

3. 实现输出数据格式转换

以下Python代码示例展示了如何将一个模拟的模型输出(一个或多个人体的关键点列表)转换为用户所需的特定JSON格式。

import json

def convert_model_output_to_custom_json(model_outputs_per_image):
    """
    将姿态估计模型的输出(每人一个关键点列表)转换为自定义的JSON格式。

    Args:
        model_outputs_per_image (list): 图像中每个人的姿态估计结果列表。
                                        每个元素是一个包含17个关键点的列表,
                                        每个关键点为 [x, y, confidence]。
                                        例如:[[[x1,y1,c1], ..., [x17,y17,c17]], ...]
                                        如果模型未检测到人,此列表可以为空。

    Returns:
        dict: 符合自定义格式的JSON字典。
    """
    people_data = []

    for person_keypoints_list in model_outputs_per_image:
        # 将每个人的关键点列表 [x, y, confidence] 展平为 [x1, y1, c1, x2, y2, c2, ...]
        flat_keypoints = []
        for kp in person_keypoints_list:
            flat_keypoints.extend(kp)

        # 确保 pose_keypoints 列表的长度为 51 (17个关键点 * 3个值)
        # 如果模型输出的关键点数量不足17个,或者某些关键点未被检测到(通常用 [0,0,0] 表示),
        # 则需要进行填充或截断。这里我们假设模型输出的每个人的关键点列表已经包含17个元素,
        # 并且未检测到的关键点以 [0.0, 0.0, 0.0] 表示。
        expected_keypoints_count = 17
        expected_flat_length = expected_keypoints_count * 3

        if len(flat_keypoints) < expected_flat_length:
            # 如果实际关键点少于预期,用0填充
            flat_keypoints.extend([0.0] * (expected_flat_length - len(flat_keypoints)))
        elif len(flat_keypoints) > expected_flat_length:
            # 如果实际关键点多于预期,进行截断
            flat_keypoints = flat_keypoints[:expected_flat_length]

        person_entry = {
            "face_keypoints": [],  # 根据用户需求,保持为空
            "pose_keypoints": flat_keypoints,
            "hand_right_keypoints": [], # 根据用户需求,保持为空
            "hand_left_keypoints": []   # 根据用户需求,保持为空
        }
        people_data.append(person_entry)

    custom_json_output = {
        "version": 1.0,
        "people": people_data
    }
    return custom_json_output

# --- 模拟模型输出数据 ---
# 假设模型检测到一个人,并输出了17个关键点。
# 其中一些关键点可能未被检测到,用 [0, 0, 0] 表示,这与用户提供的示例一致。
simulated_person_keypoints = [
    [104.81, 34.44, 0.91], # 0: 鼻子
    [83.90, 80.05, 0.72],  # 1: 左眼
    [42.58, 79.82, 0.61],  # 2: 右眼
    [34.77, 142.66, 0.75], # 3: 左耳
    [31.24, 204.80, 0.52], # 4: 右耳
    [122.45, 81.22, 0.58], # 5: 左肩
    [125.48, 145.92, 0.70],# 6: 右肩
    [131.52, 192.00, 0.36],# 7: 左肘
    [58.70, 193.86, 0.29], # 8: 右肘
    [0.0, 0.0, 0.0],       # 9: 左腕 (未检测到)
    [107.84, 196.42, 0.32],# 10: 右腕
    [0.0, 0.0, 0.0],       # 11: 左髋 (未检测到)
    [0.0, 0.0, 0.0],       # 12: 右髋 (未检测到)
    [93.98, 28.16, 0.93],  # 13: 左膝
    [107.08, 26.99, 0.93], # 14: 右膝
    [71.30, 32.58, 0.88],  # 15: 左踝
    [0.0, 0.0, 0.0]        # 16: 右踝 (未检测到)
]

# 如果图像中有多个人,则 model_outputs_per_image 会是一个包含多个上述列表的列表
# 例如:[simulated_person_keypoints_1, simulated_person_keypoints_2]
simulated_model_outputs_for_image = [simulated_person_keypoints] 

# 执行转换
custom_json_result = convert_model_output_to_custom_json(simulated_model_outputs_for_image)

# 打印结果
print(json.dumps(custom_json_result, indent=4))

代码解释:

  • convert_model_output_to_custom_json 函数接收一个列表,其中每个元素代表一个检测到的人的关键点数据。
  • 对于每个人,其关键点列表([[x,y,c], ...])被展平为单个列表([x1,y1,c1, ...]),以符合用户pose_keypoints的格式。
  • 函数确保展平后的pose_keypoints列表长度为51(17个关键点 * 3个值),如果不足则用0.0填充,如果超出则截断。这处理了模型可能输出不同数量关键点的情况,并与用户示例中部分关键点为[0,0,0]的情况保持一致。
  • face_keypoints、hand_right_keypoints和

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

716

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

626

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

739

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

699

2023.08.11

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

7

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号