实验八 Pandas统计分析基础(任务二)

实验目的

  1. 了解常用的数据分析方法
  2. 掌握pandas的基本操作
  3. 掌握缺失值处理方法
  4. 掌握重复值处理方法
  5. 掌握异常值处理方法
  6. 掌握数据分组与差分的应用

实验内容

任务2 导入鸢尾花数据,实现以下操作
特别注意:导入后的DataFrame仅含5列:
Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species
(1)读入数据,输出前五行
(2)统计每个品种的数量
(3)按品种划分,每个品种的花萼,花瓣的长度和宽度的最大值分别是多少?
(4)计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的跨度范围,即最大值减去最小值
(5)计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的平均值、最大值

实验过程

(1)读入数据,输出前五行
程序代码如下

import pandas as pd
iris = pd.read_csv('D:\\iris.csv')
print('前5行的数据为:\n',iris.head())

(2)统计每个品种的数量
程序代码如下

import pandas as pd
iris = pd.read_csv('D:\\iris.csv')
print('每个品种的数量为:\n',iris['Species'].value_counts())

(3)按品种划分,每个品种的花萼,花瓣的长度和宽度的最大值分别是多少?
程序代码如下

import pandas as pd
iris = pd.read_csv('D:\\iris.csv')
print('每个品种各指标的最大值为:\n',iris.groupby('Species').max())

(4)计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的跨度范围,即最大值减去最小值
程序代码如下

import pandas as pd
iris = pd.read_csv('D:\\iris.csv')
def range_iris(arr):
    return arr.max()-arr.min()
print('每个品种所有属性数值的跨度范围为:\n',iris.groupby('Species').agg(range_iris))

(5)计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的平均值、最大值
程序代码如下

import pandas as pd
iris = pd.read_csv('D:\\iris.csv')
def range_iris(arr):
    return arr.max()-arr.min()
print('每个品种所有属性数值的平均值、最大值为:\n',iris.groupby('Species').mean(),iris.groupby('Species').max())

你可能感兴趣的:(Python程序设计基础与应用,pandas,python,数据分析)