数据研发学习笔记07:利用Python对数据进行描述性统计

文章目录

  • 1.1 集中趋势
    • 1.1 均值
    • 1.2 中位数
    • 1.3 众数
  • 2 离散趋势
    • 2.1 极差
    • 2.2 四分位数
    • 2.3 四分位数极差(四分位距)
    • 2.4 五数概括
    • 2.5 箱线图
    • 2.6 方差和标准差
    • 2.7 DataFrame描述性统计
  • 3 基本统计图
    • 3.1 条形图
    • 3.2 饼状图
    • 3.3 折线图
    • 3.4 直方图
    • 3.5 散点图
    • 3.6 分位数-分位数图
  • 4 高级绘图
    • 4.1 雷达图
    • 4.2 词云图
  • 5 计算数值属性的三种距离
    • 5.1 欧氏距离
    • 5.2 曼哈顿距离
    • 5.3 明可夫斯基距离

1.1 集中趋势

数据研发学习笔记07:利用Python对数据进行描述性统计_第1张图片
数据研发学习笔记07:利用Python对数据进行描述性统计_第2张图片
数据研发学习笔记07:利用Python对数据进行描述性统计_第3张图片

1.1 均值

在这里插入图片描述

1.2 中位数

在这里插入图片描述

1.3 众数

(1)使用numpy
数据研发学习笔记07:利用Python对数据进行描述性统计_第4张图片
(2)直接利⽤scipy下stats模块【推荐】
数据研发学习笔记07:利用Python对数据进行描述性统计_第5张图片

2 离散趋势

数据研发学习笔记07:利用Python对数据进行描述性统计_第6张图片

2.1 极差

数据研发学习笔记07:利用Python对数据进行描述性统计_第7张图片

2.2 四分位数

数据研发学习笔记07:利用Python对数据进行描述性统计_第8张图片

2.3 四分位数极差(四分位距)

在这里插入图片描述

2.4 五数概括

数据研发学习笔记07:利用Python对数据进行描述性统计_第9张图片

2.5 箱线图

(1)单一箱线图
数据研发学习笔记07:利用Python对数据进行描述性统计_第10张图片
(2)多个箱线图
在这里插入图片描述
数据研发学习笔记07:利用Python对数据进行描述性统计_第11张图片

2.6 方差和标准差

数据研发学习笔记07:利用Python对数据进行描述性统计_第12张图片
在这里插入图片描述

2.7 DataFrame描述性统计

数据研发学习笔记07:利用Python对数据进行描述性统计_第13张图片

3 基本统计图

在这里插入图片描述

3.1 条形图

数据研发学习笔记07:利用Python对数据进行描述性统计_第14张图片

3.2 饼状图

数据研发学习笔记07:利用Python对数据进行描述性统计_第15张图片

3.3 折线图

数据研发学习笔记07:利用Python对数据进行描述性统计_第16张图片

3.4 直方图

数据研发学习笔记07:利用Python对数据进行描述性统计_第17张图片

3.5 散点图

数据研发学习笔记07:利用Python对数据进行描述性统计_第18张图片

3.6 分位数-分位数图

数据研发学习笔记07:利用Python对数据进行描述性统计_第19张图片

4 高级绘图

4.1 雷达图

数据研发学习笔记07:利用Python对数据进行描述性统计_第20张图片

4.2 词云图

(1)安装包

pip install wordcloud
pip install jieba

(2)绘制词云
使⽤数据为2019年政府⼯作报告全⽂
⽂件:“政府⼯作报告2019.txt”
原⽂地址:http://www.gov.cn/zhuanti/2019qglh/2019lhzfgzbg/index.htm
数据研发学习笔记07:利用Python对数据进行描述性统计_第21张图片

5 计算数值属性的三种距离

数据研发学习笔记07:利用Python对数据进行描述性统计_第22张图片
在这里插入图片描述

5.1 欧氏距离

数据研发学习笔记07:利用Python对数据进行描述性统计_第23张图片

5.2 曼哈顿距离

数据研发学习笔记07:利用Python对数据进行描述性统计_第24张图片

5.3 明可夫斯基距离

数据研发学习笔记07:利用Python对数据进行描述性统计_第25张图片

你可能感兴趣的:(数据研发学习笔记,Python相关实用技巧,数据分析学习总结笔记)