从字符串中调用变量：Pandas数据处理技巧

心靈之曲

发布时间：2025-08-07 16:30:14

696人浏览过

来源于php中文网

原创

从字符串中调用变量：pandas数据处理技巧

本文介绍了一种在 Pandas DataFrame 中处理包含变量的字符串表达式的方法，尤其适用于从 Excel 读取数据后，需要根据 DataFrame 中其他列的值计算新列的情况。文章提供了一种安全且高效的解决方案，避免使用 eval() 函数，并详细解释了实现步骤和代码示例。

在数据处理过程中，我们经常会遇到从外部文件（如 Excel）读取数据的情况。读取后的数据可能包含一些字符串表达式，这些表达式依赖于 DataFrame 中的其他列的值。例如，某一列的值可能是 "A+2"，其中 A 代表另一列的值。如何安全有效地计算这些表达式的值，并将结果存储到新的列中，是本文要解决的问题。

解决方案：字符串分割与数值计算

为了避免使用 eval() 函数（因为其存在安全风险），我们可以采用字符串分割和数值计算的方法。具体步骤如下：

创建示例 DataFrame： 首先，创建一个包含示例数据的 DataFrame，模拟从 Excel 读取的数据。

import pandas as pd

df = pd.DataFrame({'ID': ['01', '02'], 'A': [5, 8], 'B': ['A+2', 'A+4']})
print(df)

提取数值部分： 使用 str.split('+') 方法将 'B' 列的字符串按照 '+' 分割成两部分，然后使用 str[1] 提取分割后的第二部分（即数值部分）。将提取的数值部分存储到新列 'C' 中。

df['C'] = df['B'].str.split('+').str[1]
print(df)

类型转换： 将 'A' 列和 'C' 列的数据类型转换为 int64，以便进行数值计算。

df = df.astype({'A': 'int64', 'C': 'int64'})
print(df)

计算新列： 将 'A' 列和 'C' 列的值相加，并将结果更新到 'C' 列。

df['C'] = df['A'] + df['C']
print(df)

完整代码示例：

一览AI绘图

一览AI绘图是一览科技推出的AIGC作图工具，用AI灵感助力，轻松创作高品质图片

下载

import pandas as pd

# 创建示例 DataFrame
df = pd.DataFrame({'ID': ['01', '02'], 'A': [5, 8], 'B': ['A+2', 'A+4']})

# 提取数值部分
df['C'] = df['B'].str.split('+').str[1]

# 类型转换
df = df.astype({'A': 'int64', 'C': 'int64'})

# 计算新列
df['C'] = df['A'] + df['C']

print(df)

输出结果：

   ID  A    B   C
0  01  5  A+2   7
1  02  8  A+4  12

注意事项：

此方法假设 'B' 列的字符串表达式总是 "A+数值" 的形式。如果表达式形式不同，需要相应地修改字符串分割的逻辑。
在进行类型转换之前，需要确保 'C' 列的值都是有效的数字字符串。如果存在非数字字符串，会导致类型转换失败。
如果需要处理更复杂的表达式，可以考虑使用正则表达式进行匹配和提取。

总结：

本文提供了一种安全有效的解决方案，用于处理 Pandas DataFrame 中包含变量的字符串表达式。通过字符串分割和数值计算，我们可以避免使用 eval() 函数，提高代码的安全性和可维护性。该方法适用于从 Excel 读取数据后，需要根据 DataFrame 中其他列的值计算新列的场景。在实际应用中，需要根据具体的表达式形式进行相应的调整。

相关标签:

正则表达式 pandas 数据类型字符串类型转换 excel

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：从字符串中调用变量并进行计算：Pandas数据处理技巧下一篇：从字符串中调用变量并进行计算的实用方法

作者最新文章

DiagrammingAI：AI驱动的图表生成器，提升效率与创新

2026-01-02 10:09

《新疆好地方》注销账号方法

2026-01-02 10:12

OK钱包安全吗

2026-01-02 10:12

GitHub Copilot CLI：AI驱动的终端效率革命