数据可视化和Python数据可视化工具matplotlib

补充:数据可视化和Python数据可视化工具matplotlib

上次的笔记记录了数据采集与爬虫相关的知识,这次的笔记是对上次的笔记的补充,记录了与数据可视化相关的内容和关于python的数据可视化工具。
首先需要提到一个问题,什么是数据可视化?
举个例子,如果有一篇1000字的文章,翻来覆去都在描述两种事物之间的关系。读者对于这种长篇的文章是非常容易觉得枯燥乏味读不下去,但是如果把这段文章转换成导图的方式描述出来,可能读者对于描述的关系更加一目了然。也就是说导图的方式能让读者更直观的看到事物间关系等,那么数据可视化是一样的道理。

数据可视化旨在借助于图形化手段,将数据以视觉形式来呈现,清晰有效地传达与沟通信息,帮助人们理解数据中蕴藏的规律和现象。
数据可视化可以是静态的或交互的。几个世纪以来,人们一直在使用静态数据可视化,如图表和地图。交互式的数据可视化则相对更为先进:人们能够使用电脑和移动设备深入到这些图表和图形的具体细节,然后用交互的方式改变他们看到的数据及数据的处理方式。

数据可视化的作用与意义:
数据可视化将大量的高纬度繁琐数据以一种直观的图表的形式展现出来,使得数据在阅读方面变得极为便捷,使数据更加客观、更具说服力。
数据可视化可以帮助我们分析海量数据中所存在的潜在价值和规律。
数据可视化是数据挖掘的关键辅助工具,可以使人清晰的理解数据,从而调整我们的分析方法。

数据可视化的应用场景:
金融,股票;公司财务;医学;统计分析;自然科学等

数据可视化的常用工具:
可视化在线分析平台:Plotly
基于编程语言实现的工具:Processing,matplotlib,R,pyecharts
基于JavaScript实现的工具:Chart.js,Echarts,D3.js,flot
函数公式数据可视化功能:wolframalpha,Tangle,seaborn

1.Plotly:
Plotly 是一款用来做数据分析和可视化的在线平台,功能非常强大,可以在线绘制很多图形比如条形图、散点图、饼图、直方图等等。而且还是支持在线编辑,以及多种语言python、javascript、matlab、R等许多API。它在python中使用也很简单,直接用pip install plotly就可以了

2.matplotlib
matplotlib是Python提供的数据可视化库之一。
专门用于开发2D图表(包括3D图表)。
以渐进、交互式方式实现数据可视化。
图像结构:
数据可视化和Python数据可视化工具matplotlib_第1张图片
注:图片源自官网。

基本操作流程:
导包 import matplotlib.pyplot as np
创建画布,设置画布属性 plt.figure(figsize,dpi)
绘图 plt.plot()
plot为折线图,可以绘制多个图,可以使用不同的图形。
显示图例 plt.lengend()
添加刻度 plt.xtickets()
显示网格 plt.grid()
保存图片 plt.savefig()
显示图片 plt.show()

3.seaborn
seaborn是一种基于matplotlib的图形可视化工具。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。同时它能高度兼容NumPy与Pandas数据结构。seaborn比matplotlib更加容易使用,而且图例的风格更加现代化,更为美观。但是,相对于matplotlib更为灵活,在制作复杂度较高的图形时更有优势。
seaborn与matplotlib区别:
seaborn的底层是基于matplotlib的,他们的差异有点像在点餐时选套餐还是自己点的区别:matplotlib是独立点菜,可能费时费心但最后上桌的菜全是特别适合自己的;seaborn是点套餐,特别简单,一切都是配好的,虽然省时省心,但可能套餐里总有些菜是不那么合自己口味的。
seaborn是用户把自己常用到的可视化绘图过程进行了函数封装,形成的一个“快捷方式”,seaborn的代码更简洁,可以用一行代码实现一个清晰好看的可视化输出。但是他有一个缺点:定制化能力会比较差,只能实现固化的一些可视化模板类型;matplotlib是可以实现高度定制化绘图的,高度定制化可以让你获得最符合心意的可视化输出结果,但也因此需要设置更多的参数,因而代码更加复杂一些。

4.Echarts
Echarts是一个使用 JavaScript 实现的开源可视化库,提供了常规的折线图、柱状图、散点图、饼图、K线图,用于统计的盒形图,用于地理数据可视化的地图、热力图、线图,用于关系数据可视化的关系图、treemap、旭日图,多维数据可视化的平行坐标,还有用于 BI 的漏斗图,仪表盘,并且支持图与图之间的混搭。

5…pyecharts
pyecharts是一个Python中用于生成 Echarts 图表的类库,可以使得Echart和Python进行很好的对接。

数据可视化的流程:
1.需求分析:
业务场景分析。
明确可视化图形的需求。
确定可视化的任务。
2.数据分析:
对数据进行细致解读,分析数据的特点:数据的维度、数据的分布、值的区间和数据之间的联系等。
根据数据的特点确定设计思路。
3.匹配图形:
根据可视化的任务和数据的特点选择能的图形。
4.确定风格:
选择与业务场景相匹配的图形风格。
5.优化图形:
将数据绘制到图形各个维度上,不断调整至合理。
修改图形的颜色、图例、坐标等参数,让图形更易看懂。
6.效果测试:
是否达到预期效果。
是否满足业务需求。
主题风格、颜色是否和场景匹配。
图形是否清晰易懂。

你可能感兴趣的:(大数据学习)