Python数据分析_Pandas入门_探索酒类消费数据_Drinks

背景

Pandas练习题第三个数据集,寻找新的视角看数据

步骤

导入数据

Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第1张图片

以大洲为组进行分类,查看均值Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第2张图片

对数据进行可视化

从图中明显可以看出:

  • 欧洲的酒类消费需求最多,啤酒、白酒、红酒和每升酒精含量均值均为最高
  • 中美、南美洲啤酒、白酒消费需求较多,对红酒消费需求较少
  • 大洋洲消费结构与美洲相似,但消费需求较少
  • 非洲对啤酒需求要远高于白酒、红酒,整体消费需求较少
  • 亚洲由于传统文化影响,白酒需求最高,红酒需求最低,每升酒精含量均值最低,整体消费需求最少Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第3张图片

每个大陆(continent)的红酒消耗(wine_servings)的描述性统计值Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第4张图片

每个大陆对spirit饮品消耗的平均值,中位数,四分位数,最小值和最大值

从表中可以看出,各种酒类分布很不一致,利用箱型图对数据进行可视化Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第5张图片

绘制箱型图

  • 啤酒分布较偏向标准正态分布,没有异常值,且整体分布区间最高
  • 白酒分布有部分异常值,且全部处于偏大值一侧,分布呈右偏态
  • 红酒分布异常值极多,主要分布区间较低,但由于欧洲很多国家对红酒极高的需求量,导致了整体分布的异常
    Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第6张图片

尝试探索各个因素之间的相关性

每升酒精含量与啤酒消耗之间存在较高相关性
Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第7张图片

全球酒类消耗分布图Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第8张图片Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第9张图片Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第10张图片Python数据分析_Pandas入门_探索酒类消费数据_Drinks_第11张图片

你可能感兴趣的:(数据分析,Python学习)