0

0

Pandas Pivot Table 中计算百分比

聖光之護

聖光之護

发布时间:2025-09-08 11:42:01

|

761人浏览过

|

来源于php中文网

原创

pandas pivot table 中计算百分比

本文旨在指导读者如何在 Pandas 的 pivot_table 中计算百分比,即一个数值列除以另一个数值列的结果,并将结果整合到原有的 pivot_table 中,最终展示百分比数据。我们将利用 DataFrame.xs 函数选取 MultiIndex 的数据,进行重命名和除法运算,最后将结果合并到原始 DataFrame 中。

计算 Pandas Pivot Table 中的百分比

在使用 Pandas 进行数据分析时,pivot_table 是一个强大的工具,可以对数据进行分组和聚合。 然而,有时我们需要在 pivot_table 中计算百分比,例如计算点击率(点击次数/浏览次数)。本文将介绍一种有效的方法来实现这一目标。

使用 DataFrame.xs 和除法运算

假设我们有一个 DataFrame,其中包含 users_who_clicked 和 users_who_viewed 两列,分别表示点击次数和浏览次数。 我们的目标是创建一个 pivot_table,并在其中添加一列,显示点击率。

以下是一种实现方法:

VisionStory
VisionStory

AI视频、直播、视频播客

下载
import pandas as pd

# 示例数据
d = {('users_who_clicked','a'): [5, 6, 7, 8], 
     ('users_who_clicked','b'): [9, 10, 11, 12], 
     ('users_who_viewed','a'): [4, 1, 3, 7], 
     ('users_who_viewed','b'): [1, 3, 7, 3]}

df = pd.DataFrame(data=d)
print("Original DataFrame:\n", df)

# 1. 使用 DataFrame.xs 选取 'users_who_clicked' 列
df1 = (df.xs('users_who_clicked', axis=1, level=0, drop_level=False)
         .rename(columns={'users_who_clicked':'%'}, level=0))

# 2. 使用 DataFrame.xs 选取 'users_who_viewed' 列
df2 = (df.xs('users_who_viewed', axis=1, level=0, drop_level=False)
         .rename(columns={'users_who_viewed':'%'}, level=0))

# 3. 计算百分比
out = pd.concat([df, df1.div(df2)], axis=1)  
print("\nDataFrame with Percentage:\n", out)

代码解释:

  1. df.xs('users_who_clicked', axis=1, level=0, drop_level=False): 这行代码使用 DataFrame.xs 函数,从原始 DataFrame 中选取第一层索引为 'users_who_clicked' 的所有列。axis=1 指定按列选取,level=0 指定选取第一层索引,drop_level=False 表示保留索引层级。
  2. .rename(columns={'users_who_clicked':'%'}, level=0): 这行代码将选取的列的第一层索引重命名为 '%',用于表示百分比列。
  3. df1.div(df2): 这行代码将 df1 中的数据除以 df2 中的数据,从而计算出百分比。因为 df1 和 df2 的列索引相同,所以除法运算会自动对齐。
  4. pd.concat([df, df1.div(df2)], axis=1): 这行代码使用 pd.concat 函数,将原始 DataFrame 和计算出的百分比列拼接在一起。axis=1 指定按列拼接。

输出结果:

Original DataFrame:
   users_who_clicked     users_who_viewed          
                  a   b                a  b
0                 5   9                4  1
1                 6  10                1  3
2                 7  11                3  7
3                 8  12                7  3

DataFrame with Percentage:
   users_who_clicked     users_who_viewed            %          
                  a   b                a  b         a         b
0                 5   9                4  1  1.250000  9.000000
1                 6  10                1  3  6.000000  3.333333
2                 7  11                3  7  2.333333  1.571429
3                 8  12                7  3  1.142857  4.000000

注意事项

  • 确保用于除法运算的列的数据类型是数值类型,否则可能会出现错误。
  • 如果除数为零,可能会导致 ZeroDivisionError。 可以使用 numpy.where 或其他方法来处理这种情况。 例如,可以将除数为零的结果设置为 NaN 或其他合适的值。
  • 根据实际情况调整代码中的列名和索引层级。

总结

本文介绍了一种在 Pandas pivot_table 中计算百分比的有效方法。 通过使用 DataFrame.xs 函数选取 MultiIndex 的数据,进行重命名和除法运算,最后将结果合并到原始 DataFrame 中,我们可以轻松地在 pivot_table 中添加百分比列,从而更好地分析数据。 这种方法不仅适用于计算点击率,还可以用于计算其他类型的百分比,例如转化率、完成率等。 掌握这种方法可以帮助你更有效地使用 Pandas 进行数据分析。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

51

2025.12.04

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

299

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

数据分析的方法
数据分析的方法

数据分析的方法有:对比分析法,分组分析法,预测分析法,漏斗分析法,AB测试分析法,象限分析法,公式拆解法,可行域分析法,二八分析法,假设性分析法。php中文网为大家带来了数据分析的相关知识、以及相关文章等内容。

460

2023.07.04

数据分析方法有哪几种
数据分析方法有哪几种

数据分析方法有:1、描述性统计分析;2、探索性数据分析;3、假设检验;4、回归分析;5、聚类分析。本专题为大家提供数据分析方法的相关的文章、下载、课程内容,供大家免费下载体验。

274

2023.08.07

网站建设功能有哪些
网站建设功能有哪些

网站建设功能包括信息发布、内容管理、用户管理、搜索引擎优化、网站安全、数据分析、网站推广、响应式设计、社交媒体整合和电子商务等功能。这些功能可以帮助网站管理员创建一个具有吸引力、可用性和商业价值的网站,实现网站的目标。

724

2023.10.16

数据分析网站推荐
数据分析网站推荐

数据分析网站推荐:1、商业数据分析论坛;2、人大经济论坛-计量经济学与统计区;3、中国统计论坛;4、数据挖掘学习交流论坛;5、数据分析论坛;6、网站数据分析;7、数据分析;8、数据挖掘研究院;9、S-PLUS、R统计论坛。想了解更多数据分析的相关内容,可以阅读本专题下面的文章。

502

2024.03.13

Python 数据分析处理
Python 数据分析处理

本专题聚焦 Python 在数据分析领域的应用,系统讲解 Pandas、NumPy 的数据清洗、处理、分析与统计方法,并结合数据可视化、销售分析、科研数据处理等实战案例,帮助学员掌握使用 Python 高效进行数据分析与决策支持的核心技能。

71

2025.09.08

Java 项目构建与依赖管理(Maven / Gradle)
Java 项目构建与依赖管理(Maven / Gradle)

本专题系统讲解 Java 项目构建与依赖管理的完整体系,重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例,帮助学习者掌握 从零搭建、维护到发布 Java 工程的标准化流程,提升在实际团队开发中的工程能力与协作效率。

9

2026.01.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 3.5万人学习

Pandas 教程
Pandas 教程

共15课时 | 0.9万人学习

ASP 教程
ASP 教程

共34课时 | 3.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号