六、可视化

当数据大的时候,先利用聚类等数据挖掘的算法,才能进行数据到可视化的过程。

一些可视化原则:位置,大小,纹理,颜色,方向,形状。

一些可视化场景:文本可视化(sentiment),时序数据可视化(time,股票),高位数据可视化,机器学习相关可视化,(社交网络)图可视化,科学可视化,交互。

机器学习学习的是一种映射,训练集上得出的结论应用到新的数据上,进行判断。

matplotlib:
plot:最简单的沿坐标轴画线函数
hist:条形图(bins指定条形数目,alpha指定透明度)
scatter:散点图
pandas:(data.plot(kind=”))
kind=“bar”:条形图;barh:水平柱状图;line:线性图;kde:密度图
pd.scatter_matrix():散布图,两个一维数组之间的关系

1、plot:接受一组x和y的坐标,一个表示颜色和线型的字符串编写。
plot(s,y,’g—‘) 标记类型和线型必须放在颜色后面

2、刻度、标题(set_xticks, set_xticklabels)
ax.set_title() 设置标题,ax.set_xlabel设置名称

3、添加图例
方式一:zai subplot的时候传入label参数
4、添加注释
ax.text(x,y,”注释”)
5、添加图形
ax.add_patch(rect)

6、将图标保存到文件
plt.savefig(‘figpath.png’,dpi=400,bbox_inches=’tight’)

你可能感兴趣的:(数据分析)