如何在 Python 中将多个逗号分隔字符串列同时展开为多行

心靈之曲

发布时间：2026-01-06 23:02:02

956人浏览过

来源于php中文网

原创

如何在 Python 中将多个逗号分隔字符串列同时展开为多行

本文介绍使用 pandas 的 `str.split()` 与 `explode()` 方法，高效、安全地将 dataframe 中多个字符串型列表列（如 "ms" 和 "ds"）按元素一一配对展开为长格式，自动处理长度不一致时的填充（如补 nan）。

在数据清洗和预处理中，常遇到将多列逗号分隔字符串“同步展开”为多行的需求：即每行原始记录对应若干组 (MS_i, DS_j) 组合，且两列元素需按位置配对（而非笛卡尔积），当列长度不等时需用 NaN 补齐。Pandas 提供了简洁优雅的解决方案——结合 str.split()、zip_longest 和 explode()。

✅ 推荐实现（清晰、健壮、可读性强）

import pandas as pd
from itertools import zip_longest

# 示例数据
df = pd.DataFrame({
    'ID': [654, 131, 598],
    'MS': ['1500,10000,20000,30000', '1500,10000,20000', '1500,10000,20000,30000'],
    'DS': ['60,365,730', '60,365,730', '60,365,730']
})

# 步骤 1：将 MS 和 DS 列转为 list（按逗号分割）
df[['MS', 'DS']] = df[['MS', 'DS']].apply(lambda x: x.str.split(','), axis=1)

# 步骤 2：逐行 zip_longest 配对，生成元组列表（自动以 None 填充短列）
df['paired'] = df.apply(lambda row: list(zip_longest(row['MS'], row['DS'])), axis=1)

# 步骤 3：explode 展开 paired 列，再拆分为独立列
df = df.explode('paired')
df[['MS', 'DS']] = pd.DataFrame(df['paired'].tolist(), index=df.index)

# 可选：将 MS/DS 转为数值类型（原始为字符串）
df['MS'] = pd.to_numeric(df['MS'], errors='coerce')
df['DS'] = pd.to_numeric(df['DS'], errors='coerce')

print(df[['ID', 'MS', 'DS']])

输出结果：

GentleAI

GentleAI是一个高效的AI工作平台，为普通人提供智能计算、简单易用的界面和专业技术支持。让人工智能服务每一个人。

下载

    ID     MS    DS
0  654   1500  60.0
0  654  10000 365.0
0  654  20000 730.0
0  654  30000   NaN
1  131   1500  60.0
1  131  10000 365.0
1  131  20000 730.0
2  598   1500  60.0
2  598  10000 365.0
2  598  20000 730.0
2  598  30000   NaN

⚠️ 注意事项与最佳实践

zip_longest vs zip：务必使用 itertools.zip_longest（而非内置 zip），否则短列会被截断，丢失数据；
fillvalue 参数：默认为 None，符合 pandas 的缺失值语义；若需显式 'Nan' 字符串，请传入 fillvalue='Nan'，但注意这会改变数据类型（非数值）；
性能优化：对大数据集，避免 apply(..., axis=1) 循环；本方案虽简洁，若性能敏感，可改用 pd.concat + map 手动构建索引，但可读性下降；
空值/异常处理：str.split(',') 对空字符串返回 ['']，对 NaN 返回 NaN；建议前置清洗：df[['MS','DS']] = df[['MS','DS']].fillna('')；
扩展性：该模式可轻松扩展至 3+ 列（如新增 'TS' 列），只需在 zip_longest(...) 中添加对应字段，并调整 pd.DataFrame(...).tolist() 的解包逻辑。

掌握此方法，即可稳健应对多列字符串同步展开这一高频数据整形任务。

如何优雅地避免在子类未重写方法时调用父类的昂贵初始化逻辑

如何用更 Pythonic 的方式清洗字符串以生成规范列名

如何准确获取当前波斯历（Jalali）月份的最后一天

Python怎么去除字符串中间的空格_字符串内部空格删除方法

Python中\与\的区别_Python单反斜杠与双反斜杠转义差异

相关标签:

python 大数据 app ai 数据清洗 red Python pandas 数据类型字符串循环 map 性能优化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Pandas 中将多个逗号分隔的列表列同时展开为多行下一篇：如何在Python项目中正确跨包导入模块

作者最新文章

SQLite 语法错误排查与数据库初始化修复指南

2026-01-07 20:55

Laravel/PHP 中将数组或集合的键动态替换为指定字段值的完整教程

2026-01-07 21:02

如何稳定获取 HTML 元素的 data-id 属性并实现导航联动

2026-01-07 21:10

JavaScript 中 setTimeout 的执行时机与回调函数作用域详解

2026-01-07 21:14

如何正确通过点击控制按钮获取 data-id 并激活对应页面区块

2026-01-07 21:32

如何使用 Jsoup 精确统计指定标签（如 h3）之后的同级 p 元素数量

2026-01-07 21:32

Go install 不生成可执行文件的常见原因与正确项目结构指南

2026-01-07 21:45

如何将路径列表转换为嵌套字典结构并为末级节点赋值

2026-01-07 21:46

加密库 libsodium 1.0.21 发布

2026-01-07 22:11

PHP 8.0+ 中安全追加字符串到未知 SESSION 变量的简洁方案

2026-01-07 22:13

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

734

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

631

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

753

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1258

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

705

2023.08.11