如何根据列名重复 DataFrame 列并按规则均分数值

心靈之曲

发布时间：2026-01-08 23:57:08

482人浏览过

来源于php中文网

原创

如何根据列名重复 DataFrame 列并按规则均分数值

本文介绍一种高效、无警告的 pandas 方法：根据列名（如 "tridem"、"tandem"）动态重复对应列，并将原值按指定份数均分，彻底规避 `performancewarning: indexing past lexsort depth` 错误。

在数据处理中，常需依据列语义（而非位置）对 DataFrame 进行结构化扩展。例如，工程载荷分析中，“Tridem”轴组需拆分为 3 份均布载荷，“Tandem”需拆为 2 份，而“Single”保持不变。原始代码通过循环 + 原地赋值实现，但会触发 PerformanceWarning——这是因为 Pandas 在非字典序索引（如重复列名未预排序）下进行链式赋值时，内部索引优化失效，影响性能与稳定性。

推荐采用向量化、一次性构建方案，核心思路是：

定义列名到重复次数的映射（如 {'Single': 1, 'Tandem': 2, 'Tridem': 3}）；
使用 .map() 获取每列对应的重复数 rep；
先对原 DataFrame 按列广播除法（.div(rep, axis=1)），再用 np.repeat 同时重复数据和列名。

以下是完整可运行示例：

import pandas as pd
import numpy as np

# 构造原始数据（注意：columns 应传入 list，而非嵌套 list）
weight = [700, 1500, 1200, 2700]
name = ['Single', 'Tridem', 'Tandem', 'Tridem']
ol_axle = pd.DataFrame([weight], columns=name)  # ✅ 正确写法

# 定义重复规则：列名 → 重复次数
n = {'Single': 1, 'Tandem': 2, 'Tridem': 3}

# 步骤1：计算每列需重复的次数
rep = ol_axle.columns.map(n)

# 步骤2：先均分数值，再重复列（向量化，零警告）
out = pd.DataFrame(
    np.repeat(ol_axle.div(rep, axis=1), rep, axis=1),
    columns=np.repeat(ol_axle.columns, rep),
    index=ol_axle.index
)

print(out)

输出结果：

Veed Video Background Remover

Veed推出的视频背景移除工具

下载

   Single  Tridem  Tridem  Tridem  Tandem  Tandem  Tridem  Tridem  Tridem
0   700.0   500.0   500.0   500.0   600.0   600.0   900.0   900.0   900.0

✅ 优势说明：

无性能警告：全程避免原地索引赋值，使用 np.repeat 和 pd.DataFrame 构造器一次性生成结果；
逻辑清晰：分离“重复逻辑”（map + repeat）与“数值变换”（div），便于维护和扩展；
健壮性强：自动适配任意顺序、任意重复次数的列名组合，无需手动标记状态（如 tridem_divided 标志位）。

⚠️ 注意事项：

原始代码中 columns=[name] 会导致列名为 [['Single','Tridem','Tandem','Tridem']]（即单元素列表嵌套），应改为 columns=name；
若列名存在未定义于 n 字典中的值（如 'Quad'），.map(n) 将返回 NaN，引发除零错误，建议添加默认值：ol_axle.columns.map(n).fillna(1).astype(int)；
如需保留整数类型，可在最后链式调用 .astype(int)，但需确保除法结果为整除（或使用 // 整除运算符）。

此方法兼顾可读性、性能与鲁棒性，是处理语义化列重复任务的标准实践。

相关标签:

pandas 运算符 int 循环整数类型 map

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何根据列名规则重复 DataFrame 列并均分对应值下一篇：python如何画函数图像

作者最新文章

Chart.js 动态切换图表类型（Line/Bar/Pie）的完整解决方案

2026-01-08 10:59

如何分析视频号话题数据？话题数据怎么删除？

2026-01-08 11:00

P&ID图终极指南：掌握工艺流程图的绘制与解读

2026-01-08 11:02

小米玄戒o1是自研的吗

2026-01-08 11:04

抖音来客企业号是什么？如何申请抖音来客企业号？

2026-01-08 11:06

AI 销售助手演示：提升客户互动和业务增长

2026-01-08 11:10

Zapier Agents终极指南：AI自动化工作流程，提升效率

2026-01-08 11:15

《尖叫皇后》：ASMR沙龙背后的美发师，当心“枕边人”！

2026-01-08 11:17

Tempo.new + Supabase：AI驱动的快速应用开发指南

2026-01-08 11:21

剪映如何将画面定格

2026-01-08 11:28

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1463

2023.10.24

Go语言中的运算符有哪些

Go语言中的运算符有：1、加法运算符；2、减法运算符；3、乘法运算符；4、除法运算符；5、取余运算符；6、比较运算符；7、位运算符；8、按位与运算符；9、按位或运算符；10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

227

2024.02.23

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

315

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

531

2024.08.29