python大数据分析|第5课 数据可视化分析

1.调用数据

df=pd.read_csv('WorldIndex.csv')
df.head()
python大数据分析|第5课 数据可视化分析_第1张图片
WorldIndex

2.查看数据

df.info()


RangeIndex: 164 entries, 0 to 163
Data columns (total 5 columns):
Country            164 non-null object
Continent          164 non-null object
Life_expectancy    164 non-null float64
GDP_per_capita     164 non-null float64
Population         164 non-null int64
dtypes: float64(2), int64(1), object(2)
memory usage: 5.2+ KB

看数据表格有多少行和列:
df.shape
(164,5)
查看有哪些大陆:
df.continent.unique()
array(['Africa', 'Asia', 'Europe', 'North America', 'Oceania', 'South America'], dtype=object)
这些大陆各有几个国家:
df.continent.value_counts()

Africa           48
Europe           41
Asia             36
North America    19
South America    11
Oceania           9
Name: Continent, dtype: int64

3.将数据进行可视化操作:

df.plot(kind='scatter',x="Life_expectancy",y="GDP_per_capita")

python大数据分析|第5课 数据可视化分析_第2张图片
散点图

用不同的颜色表示不同大洲的国家,并将图表放大:

Africa=df[df.Continent=='Africa']
Asia=df[df.Continent=='Asia']
Europe=df[df.Continent=='Europe']
North_America=df[df.Continent=='North America']
Oceania=df[df.Continent=='Oceania']
South_America=df[df.Continent=='South America']

ax=Africa.plot(kind='scatter',x="Life_expectancy",y="GDP_per_capita",color='Red',label='Africa',figsize=(10,6))
Asia.plot(kind='scatter',x="Life_expectancy",y="GDP_per_capita",color='Green',ax=ax,label='Asia')
Europe.plot(kind='scatter',x="Life_expectancy",y="GDP_per_capita",color='Orange',ax=ax,label='Europe')
North_America.plot(kind='scatter',x="Life_expectancy",y="GDP_per_capita",color='Yellow',ax=ax,label='North America')
Oceania.plot(kind='scatter',x="Life_expectancy",y="GDP_per_capita",color='Blue',ax=ax,label='Oceania')
South_America.plot(kind='scatter',x="Life_expectancy",y="GDP_per_capita",color='Black',ax=ax,label='South America')
python大数据分析|第5课 数据可视化分析_第3张图片

4.分析

通过以上的图形我们可以发现,非洲国家的人均GDP和人均普遍处于比较靠下的位置,其大多数国家的人均寿命都不足65岁;而相比较而言欧洲国家的这两项数据普遍处于世界前列(欧洲人民很幸福啊)。并且这两个大洲相对于其他大洲而言数据比较集中,比如我们身处的亚洲数据分散得比较开,这也说明亚洲各个国家之间发展不均衡。
同时我们也可以发现,其实人均寿命和人均GDP并没有正相关系存在,也就是说,你能活多久并不取决于你能挣多少钱。

你可能感兴趣的:(python大数据分析|第5课 数据可视化分析)