我们使用groupby这个分组函数吧。
我们给出数据集。
我们想统计每个u对应的a,并统计同一个a下面u的出现次数;
代码如下:
df = pd.DataFrame({'a':[1,1,1,3,3,3,3,3,3,3,3,8],'u':[99,98,67,65,63,67,57,55,51,53,53,55]})
df
Out[72]:
a u
0 1 99
1 1 98
2 1 67
3 3 65
4 3 63
5 3 67
6 3 57
7 3 55
8 3 51
9 3 53
10 3 53
11 8 55
gropus=df.groupby(['a'])
row = {'a':[],'u':[],'第几次出现':[]}
for k,group in gropus:
row['a'] += group.a.values.tolist()
row['u'] += group.u.values.tolist()
row['第几次申请'] += ((group.index-group.index[0])%group.index.size+1).values.tolist()
pd.DataFrame(row)
Out[73]:
a u 第几次出现
0 1 99 1
1 1 98 2
2 1 67 3
3 3 65 1
4 3 63 2
5 3 67 3
6 3 57 4
7 3 55 5
8 3 51 6
9 3 53 7
10 3 53 8
11 8 55 1