机器学习pandas库(五)日考训练

题目要求

【案例描述及要求】
利用pandas读取HOUSE数据集,具体要求如下:
1.加载数据集(20分
2.使用所学知识,切片提取条件为Global_intensity大于15的数据样本。(40分)
3.在上题基础上,统计Voltage的频数,并计算均值。(40分)

数据准备

机器学习pandas库(五)日考训练_第1张图片

代码如下

import pandas as pd
# 加载数据
data = pd.read_excel(r'HOUSE.xls')
# 2.使用所学知识,切片提取条件为Global_intensity大于15的数据样本。(40分)
sub_data = data[data['Global_intensity'] > 15]
print(sub_data)
# 3.在上题基础上,统计Voltage的频数,并计算均值。(40分)
count_Vo = data['Voltage'].value_counts()
avg_Vo = data['Voltage'].mean()
print('频数是:\n',count_Vo)
print('均值是:\n',avg_Vo)

效果如下

机器学习pandas库(五)日考训练_第2张图片

你可能感兴趣的:(机器学习项目练习)