0

0

Pandas DataFrame:根据条件批量更新多行数据

心靈之曲

心靈之曲

发布时间:2025-08-28 23:06:02

|

552人浏览过

|

来源于php中文网

原创

pandas dataframe:根据条件批量更新多行数据

本文介绍了如何使用 Pandas DataFrame 根据条件批量更新多行数据,避免循环操作,提高代码效率。核心思路是利用 map() 函数和 update() 函数,将第二个 DataFrame 转换为映射关系,然后根据第一个 DataFrame 的 Symbol 列进行匹配,批量更新 SecurityID 列。

批量更新 DataFrame 中匹配条件的行

在数据处理过程中,经常会遇到需要根据一个 DataFrame 的信息,批量更新另一个 DataFrame 中符合特定条件的行。例如,我们有两个 DataFrame,df1 和 df2,其中 df1 包含 Symbol 和 SecurityID 列,df2 包含 Symbol 和对应的 SecurityID。我们需要根据 df2 中的 Symbol 和 SecurityID 的对应关系,更新 df1 中所有 Symbol 相同的行的 SecurityID。

以下是一种高效的方法,无需循环即可实现此目的:

1. 准备数据

首先,创建两个示例 DataFrame:

import pandas as pd

# DataFrame 1
data1 = {'Symbol': ['UGE', 'UGE', 'UGE', 'UGE', 'UGE', 'UGE'],
         'SecurityID': [None, None, None, None, None, None]}
df1 = pd.DataFrame(data1)

# DataFrame 2
data2 = {'Symbol': ['UGE'],
         'SecurityID': [128901]}
df2 = pd.DataFrame(data2)

2. 使用 map() 和 update() 函数

核心代码如下:

df1['SecurityID'].update(df1['Symbol'].map(df2.set_index('Symbol')['SecurityID']))

这行代码分两步完成:

网趣网上购物系统HTML静态版
网趣网上购物系统HTML静态版

网趣购物系统静态版支持网站一键静态生成,采用动态进度条模式生成静态,生成过程更加清晰明确,商品管理上增加淘宝数据包导入功能,与淘宝数据同步更新!采用领先的AJAX+XML相融技术,速度更快更高效!系统进行了大量的实用性更新,如优化核心算法、增加商品图片批量上传、谷歌地图浏览插入等,静态版独特的生成算法技术使静态生成过程可随意掌控,从而可以大大减轻服务器的负担,结合多种强大的SEO优化方式于一体,使

下载
  • df2.set_index('Symbol')['SecurityID']: 这部分代码将 df2 的 Symbol 列设置为索引,然后选择 SecurityID 列,从而创建一个 Series,其中 Symbol 作为索引,SecurityID 作为值。本质上创建了一个从 Symbol 到 SecurityID 的映射。
  • df1['Symbol'].map(...): 这部分代码使用 df1 的 Symbol 列,利用 map() 函数,将每个 Symbol 映射到其对应的 SecurityID。如果 Symbol 在 df2 中不存在,则映射结果为 NaN。
  • df1['SecurityID'].update(...): 最后,使用 update() 函数,将 df1 的 SecurityID 列中,与映射结果对应位置的值进行更新。

3. 验证结果

执行完上述代码后,df1 将被更新,所有 Symbol 为 'UGE' 的行的 SecurityID 都将变为 128901。

print(df1)

输出结果:

  Symbol  SecurityID
0    UGE    128901.0
1    UGE    128901.0
2    UGE    128901.0
3    UGE    128901.0
4    UGE    128901.0
5    UGE    128901.0

完整代码示例:

import pandas as pd

# DataFrame 1
data1 = {'Symbol': ['UGE', 'UGE', 'UGE', 'UGE', 'UGE', 'UGE'],
         'SecurityID': [None, None, None, None, None, None]}
df1 = pd.DataFrame(data1)

# DataFrame 2
data2 = {'Symbol': ['UGE'],
         'SecurityID': [128901]}
df2 = pd.DataFrame(data2)

# 更新 df1 的 SecurityID
df1['SecurityID'].update(df1['Symbol'].map(df2.set_index('Symbol')['SecurityID']))

print(df1)

注意事项:

  • 确保 df2 中的 Symbol 列是唯一的,否则 set_index() 会抛出异常。 如果不唯一,需要根据实际情况进行处理,例如选择第一个值或进行聚合。
  • 如果 df1 中的 Symbol 在 df2 中不存在,则对应的 SecurityID 将被更新为 NaN。 可以使用 fillna() 函数处理这些 NaN 值。
  • update() 函数会直接修改 df1,如果需要保留原始 df1,请先进行复制。

总结:

使用 map() 和 update() 函数可以高效地批量更新 Pandas DataFrame 中匹配条件的行,避免了循环操作,提高了代码的执行效率。 这种方法在处理大型数据集时尤为重要。 理解并掌握这种方法,可以提升数据处理的效率和代码的可读性。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

51

2025.12.04

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

73

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

25

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

57

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

32

2025.11.27

python设置中文版教程合集
python设置中文版教程合集

本专题整合了python改成中文版相关教程,阅读专题下面的文章了解更多详细内容。

0

2026.01.05

从零到实战:Python 编程系统入门专题
从零到实战:Python 编程系统入门专题

本专题面向零编程基础及初学者,系统讲解 Python 编程语言的核心知识与实战技巧。内容涵盖 Python 基础语法、数据结构、函数与模块、常用标准库、简单算法思维,以及真实应用场景下的小项目实战。通过循序渐进的学习路径,帮助读者快速建立编程思维,掌握 Python 在数据处理、自动化脚本及日常开发中的实际应用能力,为后续深入学习 Web 开发、数据分析或人工智能打下坚实基础。

10

2026.01.05

php代码编辑器入口汇总
php代码编辑器入口汇总

本文整理了主流PHP代码编辑器的官网入口及在线使用链接,阅读专题下面的文章了解更多详细内容。

51

2026.01.04

php代码编辑器地址汇总
php代码编辑器地址汇总

本文整理了主流PHP代码编辑器的官网入口及在线使用链接,阅读专题下面的文章了解更多详细内容。

0

2026.01.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号