Titanic问题整理

%matplotlib作用

  • 是在使用jupyter notebook 或者 jupyter qtconsole的时候,才会经常用到%matplotlib,也就是说那一份代码可能就是别人使用jupyter notebook 或者 jupyter qtconsole进行编辑的
  • 而%matplotlib具体作用是当你调用matplotlib.pyplot的绘图函数plot()进行绘图的时候,或者生成一个figure画布的时候,可以直接在你的python console里面生成图像。

而我们在spyder或者pycharm实际运行代码的时候,可以直接注释掉这一句,也是可以运行成功的

pandas数据合并-pd.concat()

  • concat函数是在pandas底下的方法,可以将数据根据不同的轴作简单的融合

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
keys=None, levels=None, names=None, verify_integrity=False)

参数说明
objs: series,dataframe或者是panel构成的序列lsit
axis: 需要合并链接的轴(合并方向),0是行,1是列
join:连接的方式 inner,或者outer
ignore_index (重置 index)

Seaborn入门

  • 信息源:https://www.jianshu.com/p/8bb06d3fd21b
  • seaborn是python的一个可视化模块,构建于matplotlib之上,对于pandas的DataFrame这种数据结构有着很好的支持,能够大大减少构建绘图数据是所需的工作量
  • Seaborn是基于matplotlib的Python可视化库。 它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。但应强调的是,应该把Seaborn视为matplotlib的补充,而不是替代物。
  • barplot(条形图)
    条形图表示数值变量与每个矩形高度的中心趋势的估计值,并使用误差线提供关于该估计值附近的不确定性的一些指示。具体用法如下:

seaborn.barplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, estimator=(function mean), ci=95, n_boot=1000, units=None, orient=None, color=None, palette=None, saturation=0.75, errcolor='.26', errwidth=None, capsize=None, dodge=True, ax=None, **kwargs)

  • Seaborn—FacetGrid()/map()
    FacetGrid是seaborn库中的一个类,我们在初始化这个类时只需要给它传一个DataFrame的数据集即可。
    实例化这个类以后,我么就可以直接使用这个对象的方法绘制需要的图形
    https://baijiahao.baidu.com/s?id=1618970364639228034&wfr=spider&for=pc

https://blog.csdn.net/weixin_42398658/article/details/82960379
FacetGrid当您想要在数据集的子集中分别可视化变量的分布或多个变量之间的关系时,该类非常有用。一个FacetGrid可以与多达三个维度可以得出:row,col,和hue。前两个与得到的轴阵列有明显的对应关系; 将色调变量视为沿深度轴的第三个维度,其中不同的级别用不同的颜色绘制。通过使用FacetGrid数据框初始化对象以及将形成网格的行,列或色调维度的变量名称来使用该类。这些变量应该是分类的或离散的,然后变量的每个级别的数据将用于沿该轴的小平面
sns.FacetGrid(data,col=””)col表示我们按照什么进行分图

  • Seaborn—factorplot
    https://blog.csdn.net/yutao03081/article/details/79064669
  • Seaborn—kdeplot(核密度估计图)
    核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。通过核密度估计图可以比较直观的看出数据样本本身的分布特征。具体用法如下:

seaborn.kdeplot(data,data2=None,shade=False,vertical=False,kernel='gau',bw='scott',gridsize=100,cut=3,clip=None,legend=True,cumulative=False,shade_lowest=True,cbar=False, cbar_ax=None, cbar_kws=None, ax=None, *kwargs)
sns.kdeplot(x,shade=True)
-seaborn的countplot

https://www.jianshu.com/p/8bb06d3fd21b
sns.countplot 能显示该列数据值的统计分布。

一个计数图可以被认为是一个分类直方图,而不是定量的变量。基本的api和选项与barplot()相同,因此您可以比较嵌套变量中的计数。(工作原理就是对输入的数据分类,条形图显示各个分类的数量)具体用法如下:

seaborn.countplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, dodge=True, ax=None, **kwargs)

注:countplot参数和barplot基本差不多,可以对比着记忆,有一点不同的是countplot中不能同时输入x和y,且countplot没有误差棒。

  • add_legend()函数增加图例,有类别的说明

matplotlib—Pyplot

matplotlib.pyplot是一个命令型函数集合,它可以让我们像使用MATLAB一样使用matplotlib。pyplot中的每一个函数都会对画布图像作出相应的改变,如创建画布、在画布中创建一个绘图区、在绘图区上画几条线、给图像添加文字说明等

Other

  1. x轴上下限设定xlim([a,b]);
    y轴上下限设定ylim([a,b])
  2. python中的set()是一个无序的不重复的元素集
  3. map()函数:map() 会根据提供的函数对指定序列做映射。
    第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次 function 函数返回值的新列表。

map(function, iterable, ...) - function -- 函数 - iterable -- 一个或多个序列

你可能感兴趣的:(Titanic问题整理)