pandas入门——数据分组

数据分组

  • 数据的导入
f = pd.read_csv("D://NBA.csv", encoding="gbk")
print(type(f))
print(f.shape)
# 按条件进行分组
g1 = f.groupby(by=list(["collage"]))
print(type(g1))
print(g1)
  • 获取分组数据的第一行
print(g1.first())
  • 获取每组的个数
print(g1.size())
  • 获取每一组的描述信息
print(g1.describe())
  • 查看每一组在样本数据中所有的索引位置
print(g1.groups)
  • 选择具体的分组
print(g1.get_group("University of Wisconsin"))
  • 对分组数据进行迭代
for name, group in g1:
    print(name)
    print("-".center(50, "-"))
    print(group.shape)
  • 将函数应用到分组数据上
print(g1.aggregate(numpy.sum))
print(g1.aggregate(numpy.mean))
  • 在不同的分组列上应用不同的分组函数
print((g1.aggregate({"height": numpy.sum, "weight": numpy.mean})).rename(columns={"height": "求和", "weight": "平均数"}))

你可能感兴趣的:(数据挖掘之路)