实验八 Pandas统计分析基础(任务三)

实验目的

  1. 了解常用的数据分析方法
  2. 掌握pandas的基本操作
  3. 掌握缺失值处理方法
  4. 掌握重复值处理方法
  5. 掌握异常值处理方法
  6. 掌握数据分组与差分的应用

实验内容

任务3 从excel文件foods.xlsx读取数据,并将ID列作为索引。

  1. 输出该DataFrame。
  2. 生成如下样式的透视表,统计不同产地和类别食品价格及数量的平均值。
  3. 生成如下样式的透视表,统计不同产地和类别食品价格的最大值,缺失值填充0。
  4. 生成如下样式的透视表,统计不同产地和类别食品价格的均值,缺失值填充0,并提供分项统计。
  5. 生成如下样式的交叉表,统计不同产地和类别食品的频次。

实验过程

  1. 输出该DataFrame。

*程序代码如下

 import pandas as pd
foods = pd.read_excel('D:\\foods.xlsx')
print('输出为:\n',foods)

  1. 生成如下样式的透视表,统计不同产地和类别食品价格及数量的平均值。

*程序代码如下

 import pandas as pd
foods = pd.read_excel('D:\\foods.xlsx')
print('透视表为:\n',foods.pivot_table(['价格','数量'],index='产地',columns='类别'))

  1. 生成如下样式的透视表,统计不同产地和类别食品价格的最大值,缺失值填充0。

*程序代码如下

 
import pandas as pd
foods = pd.read_excel('D:\\foods.xlsx')
print('透视表为:\n',foods.pivot_table('价格',index='产地',columns='类别',fill_value=0))

  1. 生成如下样式的透视表,统计不同产地和类别食品价格的均值,缺失值填充0,并提供分项统计。

*程序代码如下

 import pandas as pd
foods = pd.read_excel('D:\\foods.xlsx')
print('透视表为:\n',foods.pivot_table('价格',index='产地',columns='类别',aggfunc='mean',margins=True))

  1. 生成如下样式的交叉表,统计不同产地和类别食品的频次。

*程序代码如下

 import pandas as pd
foods = pd.read_excel('D:\\foods.xlsx')
print('透视表为:\n',pd.crosstab(foods['产地'],foods['类别']))

你可能感兴趣的:(Python程序设计基础与应用,pandas,python,数据分析)