针对数据集age_fat.txt求均值,中位数,标准差,四分位数,画盒图,散点图,qq图。

要求:针对数据集age_fat.txt

  1. 计算age和fat的均值、中位数和标准差。

  2. 绘制age和fat的盒图,并分别给出第一个四分位数和第三个四分位数。

  3. 绘制基于这两个变量的散点图和q-q图。

age_fat.txt文件数据如下:

 针对数据集age_fat.txt求均值,中位数,标准差,四分位数,画盒图,散点图,qq图。_第1张图片

前期准备:安装numpy,matplotlib,scipy库。

分别使用:pip install 库名       即可在terminal下安装。

程序实现:

1.针对数据集age_fat.txt

(1)计算age和fat的均值、中位数和标准差。

import numpy as np
f2 = "./age_fat.txt"
age=[]
fat=[]
with open(f2) as txtData:
    lines = txtData.readlines()
    for line in lines:
        lineData = line.strip().split('\t')
        age.append(lineData[0])
        fat.append(lineData[1])
    age=list(map(int, age[1:]))
    fat=list(map(float, fat[1:]))
    print("age平均数:{} 中位数:{} 标准差:{}".format(np.mean(age),np.median(age),np.std(age)))
    print("fat平均数:{} 中位数:{} 标准差:{}".format(np.mean(fat),np.median(fat),np.std(fat)))

运行结果:

(2)绘制age和fat的盒图,并分别给出第一个四分位数和第三个四分位数。

代码:

import matplotlib.pyplot as plt
f2 = "./age_fat.txt"
age=[]
fat=[]
with open(f2) as txtData:
    lines = txtData.readlines()
    for line in lines:
        lineData = line.strip().split('\t')
        age.append(lineData[0])
        fat.append(lineData[1])
    age=list(map(int, age[1:]))
    fat=list(map(float, fat[1:]))
    plt.boxplot([age,fat])
    plt.show()

运行结果:

针对数据集age_fat.txt求均值,中位数,标准差,四分位数,画盒图,散点图,qq图。_第2张图片

(3)绘制基于这两个变量的散点图和q-q图。

散点图代码:

import matplotlib.pyplot as plt
from scipy import stats
f2 = "./age_fat.txt"
age=[]
fat=[]
with open(f2) as txtData:
    lines = txtData.readlines()
    for line in lines:
        lineData = line.strip().split('\t')
        age.append(lineData[0])
        fat.append(lineData[1])
    age=list(map(int,age[1:]))
    fat=list(map(float, fat[1:]))
    plt.scatter(age, fat)
    plt.show()

运行结果:

针对数据集age_fat.txt求均值,中位数,标准差,四分位数,画盒图,散点图,qq图。_第3张图片

qq图代码:

import matplotlib.pyplot as plt
from scipy import stats
f2 = "./age_fat.txt"
age=[]
fat=[]
with open(f2) as txtData:
    lines = txtData.readlines()
    for line in lines:
        lineData = line.strip().split('\t')
        age.append(lineData[0])
        fat.append(lineData[1])
    age=list(map(int,age[1:]))
    fat=list(map(float, fat[1:]))
    stats.probplot(age,dist="norm", plot=plt)
    plt.show()

运行结果:

针对数据集age_fat.txt求均值,中位数,标准差,四分位数,画盒图,散点图,qq图。_第4张图片

你可能感兴趣的:(可视化,数据挖掘,数据挖掘,python,机器学习)