
根据一列数据打上序号,相同数据打相同序号
想要为一列数据打上序号,要求上下相同数据打相同序号,不同数据序号+1,却不知如何实现?
有位热心的网友提供了以下解答:
代码实现:
import numpy as np
import pandas as pd
df = pd.DataFrame({
'data': [11, 21, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 23, 26, 26, 26, 26, 20, 26, 26, 26, 26],
'nums': 0,
})
df['nums'] = np.cumsum(df['data'].diff() != 0)
print(df)
'''
结果:
data nums
0 11 1
1 21 2
2 24 3
3 24 3
4 24 3
5 24 3
6 25 4
7 25 4
8 26 5
9 26 5
10 26 5
11 26 5
12 23 6
13 26 7
14 26 7
15 26 7
16 26 7
17 20 8
18 26 9
19 26 9
20 26 9
21 26 9
'''这段代码使用np.cumsum(df['data'].diff() != 0)计算序号,其中:
- df['data'].diff()计算相邻数据的差值,不同数据差值不为0,相同数据差值为0。
- np.cumsum()对差值序列进行累加,相同数据累加结果相同,不同数据累加结果不同。
最终得到的结果就是每个数据的序号。










