python绘图实践-泰坦尼克号绘图

最数据分析,通过直观的图来观察,无论是出自于分析还是呈现给别人看,都是很有必要的,所以就决定要学一学基本的绘图
以下是kaggle里著名的泰坦尼克号的数据分析,绘图的过程

import pandas as pd #数据分析
import numpy as np #科学计算
from pandas import Series,DataFrame

data_train = pd.read_csv(“train.csv”)
import matplotlib.pyplot as plt
fig = plt.figure()
fig.set(alpha=0.2) # 设定图表颜色alpha参数

plt.subplot2grid((2,3),(0,0)) # 在一张大图里分列几个小图
data_train.Survived.value_counts().plot(kind=’bar’)# 柱状图
plt.title(u”获救情况 (1为获救)”) # 标题
plt.ylabel(u”人数”)

plt.subplot2grid((2,3),(0,1))
data_train.Pclass.value_counts().plot(kind=”bar”)
plt.ylabel(u”人数”)
plt.title(u”乘客等级分布”)

plt.subplot2grid((2,3),(0,2))
plt.scatter(data_train.Survived, data_train.Age)
plt.ylabel(u”年龄”) # 设定纵坐标名称
plt.grid(b=True, which=’major’, axis=’y’)
plt.title(u”按年龄看获救分布 (1为获救)”)

plt.subplot2grid((2,3),(1,0), colspan=2)
data_train.Age[data_train.Pclass == 1].plot(kind=’kde’)
data_train.Age[data_train.Pclass == 2].plot(kind=’kde’)
data_train.Age[data_train.Pclass == 3].plot(kind=’kde’)
plt.xlabel(u”年龄”)# plots an axis lable
plt.ylabel(u”密度”)
plt.title(u”各等级的乘客年龄分布”)
plt.legend((u’头等舱’, u’2等舱’,u’3等舱’),loc=’best’) # sets our legend for our graph.

plt.subplot2grid((2,3),(1,2))
data_train.Embarked.value_counts().plot(kind=’bar’)
plt.title(u”各登船口岸上船人数”)
plt.ylabel(u”人数”)
plt.show()

Survived_0 = data_train.Pclass[data_train.Survived == 0].value_counts()
print(Survived_0)
Survived_1 = data_train.Pclass[data_train.Survived == 1].value_counts()
df=pd.DataFrame({u’获救’:Survived_1, u’未获救’:Survived_0})
df.plot(kind=’bar’, stacked=True)
plt.title(u”各乘客等级的获救情况”)
plt.xlabel(u”乘客等级”)
plt.ylabel(u”人数”)
plt.show()

你可能感兴趣的:(数学推导,工具类,算法实现)