0

0

用好这八条ChatGPT指令,高效完成Pandas任务

PHPz

PHPz

发布时间:2023-06-07 17:39:56

|

1855人浏览过

|

来源于51CTO.COM

转载

我们都听说过chatgpt。它不仅受到科技行业的关注,而且在更多广泛的媒体上成为头条新闻。

尽管有一些关于它在较简单任务上的性能和可靠性的批评,但ChatGPT相比较于其他大型语言模型(LLM)在各种任务中表现都很出色,已经成为生产力的重要推动力。

应用ChatGPT进行Pandas数据的清洗和分析,可以显著提高工作效率。这篇文章介绍了8个提示示例,教你如何通过询问ChatGPT来完成Pandas任务。

第一个提示:定义其角色

首先的提示要确定其作用:

提示:你是一名教我使用Pandas库的Python导师。我期待你向我解释如何使用Pandas来执行特定任务。同时,请在你的解释中给我展示代码。

在开始提问之前,我给出了DataFrame的结构,包括列名和数据类型。

第二个提示

提示:让我先告诉你我所拥有的DataFrame的情况。然后,我将开始提问。以下是以Python字典形式给出的列名和数据类型。键表示列名,值表示数据类型。

{‘store’: dtype(‘O’), ‘product_group’: dtype(‘O’), ‘product_code’: dtype(‘int64’), ‘stock_qty’: dtype(‘int64’), ‘cost’: dtype(‘float64’), ‘price’: dtype(‘float64’), ‘last_week_sales’: dtype(‘int64’), ‘last_month_sales’: dtype(‘int64’)}

这里使用一个由模拟数据准备的样本数据集。你可以从数据集库repo中下载它(https://github.com/SonerYldrm/datasets)。The file is named sales_data_with_stores.csv.。

以下是为你提供的DataFrame,供你参考:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

用好这八条ChatGPT指令,高效完成Pandas任务

DataFrame的前5行

现在我们可以开始进行Pandas任务了。

示例 1

提示:告诉我如何计算每个商店上周销售额的平均值。

虽然这只是一行简单的代码,但对于刚开始学习Pandas的人来说,可能还需要一些时间来理解。以下是ChatGPT给出的答案:

用好这八条ChatGPT指令,高效完成Pandas任务

ChatGPT给出的测试代码片段,复制粘贴如下所示。

# 导入pandasimport pandas as pd# 假设'df'是你的DataFrameaverage_sales = df.groupby('store')['last_week_sales'].mean()

ChatGPT还提供了有关代码的执行方式和输出类型的详细解释以及代码。

示例 2

提示:告诉我如何找到每个商店上个月的总利润。

对于这个任务,ChatGPT需要先弄清楚如何计算利润。让我们看看它的响应:

用好这八条ChatGPT指令,高效完成Pandas任务

# 计算每个产品的利润df['last_month_profit'] = (df['price'] - df['cost']) * df['last_month_sales']# 计算每个商店的总利润total_profit = df.groupby('store')['last_month_profit'].sum()

示例 3

在处理真实世界的数据时,我们经常会遇到缺失值的挑战。测试ChatGPT如何处理不太直接的任务。

提示:库存数量列中有一些缺失值。我想用该商店的平均库存数量替换缺失值。告诉我如何完成这个任务。

TextIn Tools
TextIn Tools

是一款免费在线OCR工具,包含文字识别、表格识别,PDF转文件,文件转PDF、其他格式转换,识别率高,体验好,免费。

下载

用好这八条ChatGPT指令,高效完成Pandas任务

# 计算每个商店的平均库存数量average_stock_qty_per_store = df.groupby('store')['stock_qty'].transform('mean')# 用该商店的平均库存数量替换'stock_qty'中的缺失值df['stock_qty'].fillna(average_stock_qty_per_store, inplace=True)

有多种方法可以解决这个任务,使用transform函数是其中一种较为有效的方式。

transform函数很重要,使用transform函数来完成此任务的理由如下:

transform函数与apply函数类似,但与apply函数不同,transform函数可以返回与输入大小相同的Series,这使得它在执行矢量化操作和广播时非常有用,特别是与groupby对象一起使用时。

示例 4

提示:告诉我如何找到每个店铺上个月销量额最高的前三种产品。

用好这八条ChatGPT指令,高效完成Pandas任务

# 首先,按'store'和'last_month_sales'对DataFrame进行排序df_sorted = df.sort_values(['store', 'last_month_sales'], ascending=[True, False])# 然后,按'store'分组,并使用apply方法选择每个组的前3行top_3_products = df_sorted.groupby('store').head(3)

它首先对整个DataFrame进行排序。我们也可以在每个组内进行排序。让我们看看ChatGPT是否知道该如何做到这一点。

示例 5

提示:是否有另一种方法可以在不先对DataFrame进行排序的情况下完成此任务?

用好这八条ChatGPT指令,高效完成Pandas任务

def top_3_products(group):return group.nlargest(3, 'last_month_sales')top_3_df = df.groupby('store').apply(top_3_products)

更高效的方法可能是首先对整个DataFrame进行排序。此示例只是想观察ChatGPT是否能提供不同的解决方案。

示例 6

提示:我想看到每个商店的上周表现与上月表现进行比较。

这是一个简单的任务,但提示并没有直接告诉ChatGPT如何完成。让我们看看它的表现如何。

用好这八条ChatGPT指令,高效完成Pandas任务

# 计算上周和上个月每个店的总销售额total_sales_last_week = df.groupby('store')['last_week_sales'].sum()total_sales_last_month = df.groupby('store')['last_month_sales'].sum()# 创建一个新的DataFrame来存储这些信息performance_df = pd.DataFrame({'LastWeekSales': total_sales_last_week,'LastMonthSales': total_sales_last_month,})# 计算从上个月到上周销售额的变化performance_df['SalesChange'] = performance_df['LastWeekSales'] - (performance_df['LastMonthSales'] / 4)

作为对上周与上月的表现相比较的反应,它找到了上周销售额与上月销售额四分之一之间存在差异,这是非常合理的。

它创建的DataFrame如下所示:

用好这八条ChatGPT指令,高效完成Pandas任务

示例 7

提示:创建一个名为critical_stock的新列,如果stock_qty小于500,则取值为1,否则取值为0。

ChatGPT为这个任务给出了3个选项,以下是我更喜欢的两个:

用好这八条ChatGPT指令,高效完成Pandas任务

# 第一种选项df['critical_stock'] = df['stock_qty'].apply(lambda x: 1 if x < 500 else 0)# 第二种选项import numpy as npdf['critical_stock'] = np.where(df['stock_qty'] < 500, 1, 0)

示例 8

提示:以大小、缺失值、数据类型和列统计信息的形式创建一个DataFrame的摘要。

虽然DataFrame的函数和方法总结起来很简单,但ChatGPT在整理它们时做得非常出色,呈现出整洁清晰的排版。

如下的是ChatGPT生成的代码:

# 导入必要的库import pandas as pd# DataFrame大小print("DataFrame Size:")print(df.shape)print("\n")# 缺失值print("Missing Values:")print(df.isnull().sum())print("\n")# 数据类型print("Data Types:")print(df.dtypes)print("\n")# 列统计信息print("Column Statistics:")print(df.describe(include='all'))

总结

以上示例展示了ChatGPT如何在数据分析中,尤其是在Pandas中,革命性地改变了常见任务的完成方式。我们不仅提高了效率,还对可以在Pandas中完成的复杂操作有了更丰富的理解。

相关专题

更多
excel制作动态图表教程
excel制作动态图表教程

本专题整合了excel制作动态图表相关教程,阅读专题下面的文章了解更多详细教程。

20

2025.12.29

freeok看剧入口合集
freeok看剧入口合集

本专题整合了freeok看剧入口网址,阅读下面的文章了解更多网址。

65

2025.12.29

俄罗斯搜索引擎Yandex最新官方入口网址
俄罗斯搜索引擎Yandex最新官方入口网址

Yandex官方入口网址是https://yandex.com;用户可通过网页端直连或移动端浏览器直接访问,无需登录即可使用搜索、图片、新闻、地图等全部基础功能,并支持多语种检索与静态资源精准筛选。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

197

2025.12.29

python中def的用法大全
python中def的用法大全

def关键字用于在Python中定义函数。其基本语法包括函数名、参数列表、文档字符串和返回值。使用def可以定义无参数、单参数、多参数、默认参数和可变参数的函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

16

2025.12.29

python改成中文版教程大全
python改成中文版教程大全

Python界面可通过以下方法改为中文版:修改系统语言环境:更改系统语言为“中文(简体)”。使用 IDE 修改:在 PyCharm 等 IDE 中更改语言设置为“中文”。使用 IDLE 修改:在 IDLE 中修改语言为“Chinese”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

16

2025.12.29

C++的Top K问题怎么解决
C++的Top K问题怎么解决

TopK问题可通过优先队列、partial_sort和nth_element解决:优先队列维护大小为K的堆,适合流式数据;partial_sort对前K个元素排序,适用于需有序结果且K较小的场景;nth_element基于快速选择,平均时间复杂度O(n),效率最高但不保证前K内部有序。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

12

2025.12.29

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

134

2025.12.29

抖音网页版入口在哪(最新版)
抖音网页版入口在哪(最新版)

抖音网页版可通过官网https://www.douyin.com进入,打开浏览器输入网址后,可选择扫码或账号登录,登录后同步移动端数据,未登录仅可浏览部分推荐内容。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

63

2025.12.29

快手直播回放在哪看教程
快手直播回放在哪看教程

快手直播回放需主播开启功能才可观看,主要通过三种路径查看:一是从“我”主页进入“关注”标签再进主播主页的“直播”分类;二是通过“历史记录”中的“直播”标签页找回;三是进入“个人信息查阅与下载”里的“直播回放”选项。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

18

2025.12.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Pandas 教程
Pandas 教程

共15课时 | 0.9万人学习

AngularJS教程
AngularJS教程

共24课时 | 2.1万人学习

XML教程
XML教程

共142课时 | 5.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号