数据分析作业二

作业:
重复课程代码
按要求绘制 人均GDP数据的直方图
设置图片标题和坐标轴名称
只显示人均GDP在2万美元以内的数据
设置区间数bins为30
颜色设置成绿色

人均GDP数据的直方图

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

%config InlineBackend.figure_format = 'retina' # 设置图像清晰度
data = pd.read_csv('WorldIndex.csv')
data.head()

data.info()


    
    RangeIndex: 177 entries, 0 to 176
    Data columns (total 5 columns):
    Country            177 non-null object
    Continent          177 non-null object
    Life_expectancy    169 non-null float64
    GDP_per_capita     169 non-null float64
    Population         176 non-null float64
    dtypes: float64(3), object(2)
    memory usage: 5.6+ KB
    


```python
# 删除包含缺失值的行
df = data.dropna()
df.info()

Int64Index: 164 entries, 0 to 175
Data columns (total 5 columns):
Country            164 non-null object
Continent          164 non-null object
Life_expectancy    164 non-null float64
GDP_per_capita     164 non-null float64
Population         164 non-null float64
dtypes: float64(3), object(2)
memory usage: 6.4+ KB
# 重新定义列名
df.columns = ['country', 'continent', 'life', 'gdp', 'popu']
plt.hist(df.gdp, bins=30, rwidth=0.9)  # bins 设置区间数,rwidth设置柱子相对宽度

plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签 

plt.xlabel('人均GDP(美元)')  # x轴名称

plt.title('人均GDP数据直方图(2015)')  # 图标题

plt.xlim([0,20000])  #x轴只显示2万内的数据

plt.show()
数据分析作业二_第1张图片
output_8_0.png

你可能感兴趣的:(数据分析作业二)