1.1什么是数据可视化
数据可视化是借助图形化的手段将一组数据以图形的形式表示,并利用数据分析和开发工具发现其中未知信息的数据处理过程。数据可视化其实是一个抽象的过程,简单来说就是将一个不易描述的事务形成一个感知画面的过程,即从数据空间到图形空间的映射。
1.2常见的数据可视化方式
折线图、柱形图、条形图、堆积图、直方图、箱型图、饼图、散点图、气泡图、误差棒图、雷达图、统计地图、3D图表
matplotlib、seaborn、ggplot、bokeh、pygal、pyecharts
(1)从Anaconda官网下载安装文件,双击启动安装程序,进入欢迎使用Anaconda3的界面
(2)【I Agree】按钮进入用户选择安装类型的界面
(3)选择采用“Just Me”方式进行安装。
(4)单击【Next】按钮进入用户选择Anaconda安装位置界面,默认安装路径。
(5)保持默认配置。第一选项为将Anaconda添加到计算机的环境变量中,第2个选项为允许Anaconda使用Python3.7,这里保持默认配置。
一直【Next】,在【Finish】,自动在默认的浏览器中打开登录或注册“AnacondaCloud”的界面,最后单击启动Jupyter Notebook(anaconda3)启动程序。
单击【New】——>【Python3】按钮,即可创建并打开一个由系统自动命名的"Untitled.ipynb"文件,在文件中编写导入pyplot模块的语句。
使用 plot()绘制折线图
使用pyplot的pla0函数可以快速绘制折线图。
x :表示x轴的数据。
y :表示y轴的数据。
fmt:表示快速设置线条样式的格式字符串。
label :表示应用于图例的标签文本。
plot()函数会返回一个包含Line2D 类对象( 代表线条)的列表。
使用bar()绘制柱形图或堆积柱形图
该函数常用参数的含义如下。
x:表示柱形的x坐标值。
height:表示柱形的高度。
width:表示柱形的宽度,默认为0.8。
bottom:表示柱形底部的y坐标值,默认为0。
align:表示柱形的对齐方式,有’center’和’edge’两个取值,其中’center’ 表示将柱形与 刻度线居中对齐; ‘edge’ 表示将柱形的左边与刻度线对齐。
tick_ label :表示柱形对应的刻度标签。
xerr, yerr: 若未设为None,则需要为柱形图添加水平 /垂直误差棒。
error_kw:表示误差棒的属性字典。