python数据分析与可视化——第二章实训

# 1.读取数据
import csv
f=open("F:\专业课程作业\python时空数据分析与可视化\white_wine.csv",'r')
# 定义读取器
reader=csv.reader(f)
data=[]#定义列表存储读取的数据
for row in reader:
    data.append(row)
for i in range(5):#打印前5行
    print(data[i])
f.close()

# 2.处理数据
# (1)查看白葡萄酒总共分为几种品质的等级
quality_list=[]
for row in data[1:]:#遍历去掉表头的数据
      quality_list.append(int(row[-1]))#将每一行的最后一个值加入到列表中
#计算品质的种类,也就是对列表去重
quality_count=set(quality_list)
print("白葡萄酒的等级:",quality_count)

 

# (2)按白葡萄酒的等级划分为7个子集,并统计每种子集的数量
content_dict={}#{'品质':'样本量'}
for row in data[1:]:
    quality=int(row[-1])
    if quality not in content_dict.keys():
        content_dict[quality]=[row]
#         print(content_dict[quality])
#         print(row)
#         print([row])
    else:
        content_dict[quality].append (row)
for  key in content_dict:
    print(key,":",len(content_dict[key]))
# content_dict

 python数据分析与可视化——第二章实训_第1张图片

#(3)计算每个数据集的固定酸度fixed acidity的均值
mean_list=[]
for key,value in content_dict.items():
    sum=0
    for row in value:
        sum=sum+float(row[0])
    mean_list.append((key,sum/len(value)))
for item in mean_list:
    print(item[0],":",item[1])

 python数据分析与可视化——第二章实训_第2张图片

你可能感兴趣的:(Python数据分析与可视化,数据分析,python)