【笔记】一个分组统计的python与sql方法

id sim
0 a 1
1 b 2
2 c 3
3 d 2
4 a 1
5 d 2

6 d 3

以上是一个数据表xx ,id --客户id,  sim--绑定的设备编码,求绑定不同数量设备的客户数量分布

python:xx.drop_duplicates().groupby('id').count().reset_index().groupby('sim').count().reset_index()

sql:select  t.sim ,count(*)from(select  t.id ,count(dictinct(t.sim)sim from xx t groupby t.id)t group by t.sim)


仅做笔记

你可能感兴趣的:(【笔记】一个分组统计的python与sql方法)