数据可视化指的是通过可视化表示来探索数据,它与数据挖掘紧紧相关,而数据挖掘指的是使用代码来探索数据集的规律和关联。数据集可以是用一行代码就能表示的小型数字列表,也可以是数以吉字节的数据。漂亮地呈现数据关乎的并非仅仅是漂亮的图片。以引人注目的简洁方式呈现数据,让人能够明白其含义,发现数据集中原本未意识到的规律和意义。
在Python中,用于可视化和分析数据的工具有:matplotlib
和Pygal
等。matplotlib是最流行的工具之一,其是一个数学绘图库,可以用它来制作简单的图表,如折线图和散点图。Pygal专注于生成适合在数字设备上显示的图表,通过使用Pygal,可在用户与图表交互时突出元素以及调整其大小,还可以轻松地调整整个图表的尺寸,使其适合在微型智能手表或巨型显示器上显示。
在Ubuntu 18.04中安装matplotlib和Pygal
本系统的Python版本是3.6.7
安装matplotlib
matplotlib的使用指南:https://matplotlib.org/
sudo apt-get install python3-dev python3-tk tk-dev
sudo apt-get install libfreetype6-dev g++
pip3 install --user matplotlib
$ python3 # 使用命令python3启动一个终端会话
>>> import matplotlib # 导入Python包:matplotlib
>>>
如果导入包没有出现任何错误信息,说明系统已安装matplotlib成功。
要查看使用matplotlib可制作的各种图表,可访问https://matplotlib.org/
中的示例画廊。单击画廊中的图表,就可查看用于生成图表的代码。
安装Pygal
pip3 install --user pygal==2.4
$ python3 # 使用命令python3启动一个终端会话
>>> import pygal # 导入Python包:pygal
>>>
如果导入包没有出现任何错误信息,说明系统已安装pygal成功。