
我在 pandas 数据框中有以下数据:
65贝德227d202我想对三列(第一、第二、第三)执行一些简单的分析(例如 sum、groupby),但这三列的数据类型是对象(或字符串)。
所以我使用了以下代码进行数据转换:
65贝德227d217但是,由于美元符号的原因,转换可能不起作用。有什么建议吗?
正确答案
- pandas 有 3 个
.replace方法:-
pandas.series.replace栏目 pandas.series.str.replacea> 对于一列-
pandas.dataframe.replace对于多个列,并且无需使用.apply
-
regex=false是默认设置,因此设置regex=true
-
-
df[df.columns[1:]]选择最后三列。 - 在
python 3.11.4、pandas 2.1.0中测试
# replace values only in selected columns
df[df.columns[1:]] = df[df.columns[1:]].replace('[\$,]', '', regex=True).astype(float)
# replace values in all columns
df = df.replace('[\$,]', '', regex=True).astype(float)
- 清理货币列的其他模式:
-
'[^.0-9]':删除除小数点外的所有非数字 -
'[^.0-9\-]':删除除小数点和负号之外的所有非数字 -
'\d':删除所有非数字,包括小数点和负号,因此适用于仅正 int 列
-










