数据分析三、pandas库 分组聚合与数据可视化

分组聚合与数据可视化

  • 一、分组聚合
    • 1.1、单层分组聚合:df.groupby(by)['列索引'].mean()。
      • 1.1.1单层分组:df.groupby(by)
      • 1.1.2聚合操作:['列索引'].mean()
    • 1.2、 多层分组聚合:df.groupby(by)['列索引'].mean()。
  • 二、数据可视化
    • 2.1绘制单条折线图:s.plot()
      • 2.1.1为 matplotlib 库添加中文字体
      • 2.1.2 绘图
    • 2.2绘制多条折线图:df.plot()
    • 2.3绘制其它类型图
      • 2.3.1饼图
      • 2.3.2条形图

一、分组聚合

1.1分组聚合操作的定义
分组聚合操作指的是按照某项规则对数据进行分组,接着对分完组的数据执行总结性统计的操作(比如求和、求均值)。根据其分组方式的不同可以分为单层分组聚合操作以及多层分组聚合操作。

1.1、单层分组聚合:df.groupby(by)[‘列索引’].mean()。

单层分组聚合操作指的是针对某一个组进行聚合操作。

In [ 3 ]
1 # 创建DataFrame对象
2 grade_df = pd.DataFrame({
   '班级': [1, 1, 1, 1, 1, 2, 2, 2, 2, 2],
3
                         '性别': ['男', '男', '女', '女', '女', '男', '男',   '男', '女', '女'],
4
                         '眼镜': ['是', '否', '是', '否', '是', '是', '是', '否', '否', '否'],
5
                         '成绩': [95, 90, 96, 92,

你可能感兴趣的:(学习笔记之Python,数据分析)