Pandas DataFrame 中基于条件生成新列的教程

聖光之護

发布时间：2025-10-20 15:17:01

603人浏览过

来源于php中文网

原创

pandas dataframe 中基于条件生成新列的教程

本文介绍了如何基于 Pandas DataFrame 中现有列的值，根据特定条件创建新列。我们将探讨使用 apply 方法和匿名函数，以避免直接使用三元运算符可能遇到的问题，并提供清晰的代码示例和解释，帮助你高效地处理字符串数据。

在 Pandas DataFrame 中，经常需要根据现有列的值创建新的列。例如，根据合同编号的格式，提取特定的信息。本文将介绍如何使用条件语句和 Pandas 的字符串处理函数来实现这一目标。

问题描述

假设我们有一个包含客户合同编号（Client Contract Number）的 DataFrame。我们的目标是创建一个新的列（Search Text），其值取决于合同编号是否包含下划线 (_)。如果包含下划线，则新列的值为下划线之前的所有字符；否则，新列的值为删除所有短划线 (-) 后的完整合同编号。

示例数据

假设我们的 DataFrame 包含以下数据：

| Client Contract Number | |---|---| | 123_2-31 | | 23-1415 | | 124124-5_259 | | 1234 |

我们期望得到以下结果：

| Search Text | |---|---| | 123 | | 231415 | | 1241245 | | 1234 |

解决方案

同徽B2B电子商务软件 V46

同徽B2B电子商务软件是国内第一个基于J2EE架构的电子商务商业程序，在国内同类软件中市场占有率位居第一。目前客户分布二十多个省份，三十几个行业，直接和间接服务500万企业,其中包括多家部级单位和世界500强企业：商务部、农业部、德赛集团、宝钢集团、江苏龙华集团、深圳中农股份、中集集团等。。网站参数管理运营商可对整个网站进行灵活的配置，适应不同的运营需求网站更新将信息生成静态页面，加快浏览速

下载

直接使用 Pandas Series 的 str.contains() 方法进行条件判断，并结合三元运算符可能会遇到 ValueError: The truth value of a Series is ambiguous 错误。这是因为 Pandas 无法直接将 Series 的真值用于条件判断。

为了解决这个问题，我们可以使用 apply 方法和匿名函数（lambda 函数）来逐行处理 DataFrame。

代码示例

import pandas as pd

# 创建示例 DataFrame
data = {"Client Contract Number": ["123_2-31", "23-1415", "124124-5_259", "1234"] }
raw_data_df = pd.DataFrame(data)

# 首先，移除所有短划线
raw_data_df['Search Text'] = raw_data_df['Client Contract Number'].str.replace('-', '')

# 然后，使用 apply 方法和匿名函数进行条件判断
raw_data_df["Search Text"] = raw_data_df["Search Text"].apply(lambda x: x.split("_")[0] if "_" in x else x)

# 打印结果
print(raw_data_df)

代码解释

移除短划线： raw_data_df['Search Text'] = raw_data_df['Client Contract Number'].str.replace('-', '') 首先创建一个新的列 Search Text，并将 Client Contract Number 列中的所有短划线替换为空字符串。
使用 apply 方法和匿名函数：
- raw_data_df["Search Text"].apply(lambda x: ...) 将 apply 方法应用于 Search Text 列，对每一行数据执行匿名函数。
- lambda x: x.split("_")[0] if "_" in x else x 定义了一个匿名函数，该函数接受一个参数 x（即每一行的 Search Text 值）。
- if "_" in x else x 判断 x 是否包含下划线。
  - 如果包含下划线，则使用 x.split("_")[0] 将字符串按 _ 分割，并取第一个元素（即下划线之前的部分）。
  - 如果不包含下划线，则直接返回 x（即删除短划线后的完整合同编号）。

注意事项

apply 方法虽然灵活，但在处理大型 DataFrame 时可能会比较慢。如果性能是关键，可以考虑使用 np.where 或 pd.Series.mask 等向量化操作。
确保理解匿名函数中的条件判断逻辑，以适应不同的数据处理需求。
在实际应用中，可能需要根据数据的具体格式进行适当的调整。

总结

本文介绍了如何使用 Pandas 的 apply 方法和匿名函数，基于条件生成新的列。这种方法可以有效地处理字符串数据，并避免直接使用三元运算符可能遇到的问题。通过理解代码示例和注意事项，你可以灵活地应用于各种数据处理场景。

Kivy 控件显示故障排除：build() 方法的正确使用

在python-socketio事件处理器中安全访问Flask应用上下文

Dash 应用中自定义 HTML 标题和页面图标

Dash应用中自定义HTML页面标题与网站图标（Favicon）的实用指南

在Dash应用中自定义HTML标题和网站图标

相关标签:

app ai pandas 运算符三元运算符 if 字符串 Lambda number

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Tkinter/CustomTkinter：实现无可见滚动条的流畅滚动体验下一篇：优化AJAX购物车：解决多商品操作时页面不刷新的问题

作者最新文章

“国补”PS5难掩Playstation在日本的颓势销量持续走低

2025-12-24 11:58

我在神界刷装备零氪钻石使用攻略

2025-12-24 12:17

IGN满分神作清单更新！63款游戏你玩过哪个？

2025-12-24 12:26

什么叫RPG游戏？连B社的制作人都不太清楚

2025-12-24 12:55

前R星技术总监：《GTA6》不太可能定价100美元但开发成本会创新高

2025-12-24 13:04

《代号三国：龙起》新视频钟晨瑶忘词很可爱

2025-12-24 13:08

曝索尼PSN账户严重安全漏洞！双重认证也难防入侵

2025-12-24 13:10

Steam新一周销量榜：《光与影：33号远征队》仅排第二《怪物猎人：荒野》上榜

2025-12-24 13:20

8.8元的神作！《杀戮尖塔》在线5.2万创下历史新高

2025-12-24 13:21

从良了！成人恐怖游戏《Project Werewulf》宣布推出全年龄版本

2025-12-24 14:07

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1428

2023.10.24

Go语言中的运算符有哪些

Go语言中的运算符有：1、加法运算符；2、减法运算符；3、乘法运算符；4、除法运算符；5、取余运算符；6、比较运算符；7、位运算符；8、按位与运算符；9、按位或运算符；10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

221

2024.02.23

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

700

2023.08.22

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

246

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

202

2023.09.04

苹果官网入口直接访问

苹果官网直接访问入口是https://www.apple.com/cn/，该页面具备0.8秒首屏渲染、HTTP/3与Brotli加速、WebP+AVIF双格式图片、免登录浏览全参数等特性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2025.12.24

热门下载

网站特效

网站源码

网站素材

前端模板