
解决python dataframe groupby和rank操作报错
在使用Pandas库对DataFrame进行分组排序时,常遇到AttributeError: 'DataFrame' object has no attribute 'rank'错误。这是因为rank()方法只能作用于Series对象,而非DataFrame对象。
正确的使用方法是将rank()应用于groupby()后的Series结果:
ok['rn'] = ok.groupby(['DISTRICT'])['count'].rank(method='first', ascending=0)
这段代码首先使用groupby('DISTRICT')对DataFrame ok按'DISTRICT'列分组,然后选择'count'列,再应用rank(method='first', ascending=0)进行排序。method='first'表示处理相同值的排名时取第一个出现的索引的排名,ascending=0表示降序排列。最终结果会将排名结果添加到名为'rn'的新列中。
通过这种方式,即可正确地对DataFrame进行分组并计算排名,避免AttributeError错误。
立即学习“Python免费学习笔记(深入)”;










