0

0

Pandas DataFrame:基于条件匹配更新多行数据

花韻仙語

花韻仙語

发布时间:2025-08-28 23:27:01

|

620人浏览过

|

来源于php中文网

原创

pandas dataframe:基于条件匹配更新多行数据

本文介绍了如何使用 Pandas DataFrame,根据另一个 DataFrame 中的数据,高效地更新满足特定条件的多行数据。通过 map() 函数结合 set_index(),避免了循环操作,实现了快速且简洁的数据更新。

利用 map() 函数更新 DataFrame

在 Pandas 中,我们经常需要根据一个 DataFrame 的信息来更新另一个 DataFrame 的数据。当需要更新的行满足特定条件,并且条件涉及到另一个 DataFrame 时,直接使用循环效率较低。这时,可以利用 map() 函数结合 set_index() 来高效地完成任务。

问题描述:

假设我们有两个 DataFrame,df1 和 df2。df1 中包含 Symbol 和 SecurityID 两列,其中 SecurityID 初始值为 NaN。df2 中也包含 Symbol 和 SecurityID 两列,并且 df2 中 Symbol 列的值在 df1 中可能存在多个相同的行。我们的目标是,对于 df1 中 Symbol 列值相同的行,将其 SecurityID 更新为 df2 中对应 Symbol 的 SecurityID 值。

解决方案:

以下是使用 map() 函数的解决方案:

import pandas as pd

# 示例数据
data1 = {'Symbol': ['UGE', 'UGE', 'UGE', 'UGE', 'UGE', 'UGE'],
         'SecurityID': [float('NaN')] * 6}
df1 = pd.DataFrame(data1)

data2 = {'Symbol': ['UGE'], 'SecurityID': [128901]}
df2 = pd.DataFrame(data2)

# 使用 map() 函数更新 df1 的 SecurityID 列
df1['SecurityID'].update(df1['Symbol'].map(df2.set_index('Symbol')['SecurityID']))

print(df1)

代码解释:

同徽B2B电子商务软件 V46
同徽B2B电子商务软件 V46

同徽B2B电子商务软件是国内第一个基于J2EE架构的电子商务商业程序,在国内同类软件中市场占有率位居第一。目前客户分布二十多个省份,三十几个行业,直接和间接服务500万企业,其中包括多家部级单位和世界500强企业:商务部、农业部、德赛集团、宝钢集团、江苏龙华集团、深圳中农股份、中集集团等。 。 网站参数管理运营商可对整个网站进行灵活的配置,适应不同的运营需求网站更新将信息生成静态页面,加快浏览速

下载
  1. df2.set_index('Symbol'): 首先,我们将 df2 的 Symbol 列设置为索引。这使得我们可以通过 Symbol 值快速查找对应的 SecurityID。
  2. df2.set_index('Symbol')['SecurityID']: 然后,我们从设置了索引的 df2 中选择 SecurityID 列,这实际上创建了一个 Series,其中索引是 Symbol,值是 SecurityID。
  3. df1['Symbol'].map(...): 接下来,我们使用 df1 的 Symbol 列调用 map() 函数。map() 函数会将 df1 中每一行的 Symbol 值作为键,去查找前面创建的 Series 中对应的值。如果找到,则返回对应的 SecurityID;如果找不到,则返回 NaN。
  4. df1['SecurityID'].update(...): 最后,我们使用 update() 函数将 df1 的 SecurityID 列更新为 map() 函数返回的结果。update() 函数会根据索引进行更新,因此只有索引匹配的行才会被更新。

输出结果:

  Symbol  SecurityID
0    UGE    128901.0
1    UGE    128901.0
2    UGE    128901.0
3    UGE    128901.0
4    UGE    128901.0
5    UGE    128901.0

可以看到,df1 中所有 Symbol 为 "UGE" 的行的 SecurityID 都被成功更新为 128901。

注意事项:

  • 确保 df2 中 Symbol 列的值是唯一的,否则 map() 函数只会返回第一个匹配的值。如果 df2 中存在重复的 Symbol 值,需要根据实际情况进行处理,例如选择第一个值、最后一个值或进行聚合操作。
  • map() 函数返回的是一个 Series,其索引与 df1 的 Symbol 列的索引相同。update() 函数会根据索引进行更新,因此可以保证只有对应的行才会被更新。
  • 如果 df2 中不存在 df1 中某些 Symbol 对应的值,则 df1 中这些行的 SecurityID 将保持不变。

总结:

通过 map() 函数结合 set_index(),我们可以避免循环操作,高效地根据另一个 DataFrame 中的数据更新 Pandas DataFrame 中满足特定条件的多行数据。这种方法简洁、高效,并且易于理解,是处理类似问题的常用技巧。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

51

2025.12.04

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

73

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

27

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

57

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

32

2025.11.27

漫蛙2入口地址合集
漫蛙2入口地址合集

本专题整合了漫蛙2入口汇总,阅读专题下面的文章了解更多详细内容。

151

2026.01.06

AO3中文版地址汇总
AO3中文版地址汇总

本专题整合了AO3中文版地址合集,阅读专题下面的文章了解更多详细内容。

82

2026.01.06

python cv2模块教程大全
python cv2模块教程大全

本专题整合了python cv2模块相关教程,阅读专题下面的文章了解更多详细教程。

41

2026.01.06

python创建txt文件教程大全
python创建txt文件教程大全

本专题整合了python创建txt文件相关教程,阅读专题下面的文章了解更多详细内容。

21

2026.01.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号