一、Plotly介绍
二、Plotly安装
三、Plotly可视化呈现
(一)IRIS数据集可视化
1、基础操作
2、编辑可视化效果的色彩及图示
(二)三角函数
(三)地图可视化
1、基础呈现
2、添加数据标签及地球模型
3、添加数据标签及3d地球模型
4、添加数据标签及等值线动态图
四、总结
Plotly成立于2013年,是一家数据可视化公司,专注于将数据科学从实验室带入业务。通过 Plotly,可以轻松地使用任何编程语言构建、部署和超大规模交互式分析应用、图形和可视化效果。
Plotly是基于javascript开发的,提供了大量与其他主流数据分析语言的API,比如Python, R, Matlab等。Plotly不仅可以从原生的Python获得支持,对于matplotlib,pandas等库也有专门为其量身定制的接口。
更多介绍可查看Plotly官网:
https://plotly.com/python/
直接在命令提示符内输入“pip3 install plotly”即可完成安装。
Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
代码如下:
import plotly.express as px
#引入第三方库
df = px.data.iris()
#iris is a pandas DataFrame
fig = px.scatter(df, x="petal_width", y="petal_length")
fig.show()
#可视化呈现
结果如下:
代码如下:
import plotly.express as px
#引入第三方库
df = px.data.iris()
#iris is a pandas DataFrame
fig = px.scatter(df, x="petal_width",
y="petal_length",
color="species",
size="petal_length",
hover_data=["petal_width"])
#设置可视化的参数
fig.show()
#呈现可视化
结果如下:
可以看到,呈现效果相较于基础操作的结果有了很大变化。不同类别花的数据都被标注上了不同的颜色,图表旁也增加了图例,更便于数据查看和分析。
利用Plotly模块,绘制正弦、余弦、正切、余切等三角函数。此处仅展示余弦函数代码,其余三角函数均可通过调整代码中的函数名称实现可视化。
代码如下:
import plotly.express as px
import numpy as np
#导入第三方库
t=np.linspace(0,2*np.pi,100)
#定义函数的点位
fig=px.line(x=t,y=np.cos(t))
#定义函数类型,如cos、sin、tan等
fig.show()
#显示图像
结果如下:
其余函数的呈现结果如下:
此处使用的数据为Plotly内置的Gapminder数据集。关于该数据集的更多内容,可查看Gapminder网站。
代码如下:
import plotly.express as px
#导入第三方库
df=px.data.gapminder().query("year==2007")
#导入gaminder地图数据
print(df[0:9])
#输出数据库
fig=px.scatter_geo(df,locations="iso_alpha",size='pop',color="continent")
#定义地图呈现数据
fig.show()
#显示图像
结果如下:
代码如下:
import plotly.express as px
#导入第三方库
df=px.data.gapminder().query("year==2007")
#导入gaminder地图数据
print(df[0:9])
#输出数据库
fig = px.scatter_geo(
df, # 数据
locations="iso_alpha", # 配合颜色color显示
color="continent", # 颜色
hover_name="country", # 悬停数据
size="pop", # 大小
animation_frame="year", # 数据帧的选择
projection="natural earth" # 全球地图
)
#定义地图呈现数据
fig.show()
#显示图像
结果如下:
可以看到,可视化效果展现为平面的地球模型,且鼠标悬停时可以显示国家名称。
代码如下:
import plotly.express as px
#导入第三方库
df=px.data.gapminder().query("year==2007")
#导入gaminder地图数据
print(df[0:9])
#输出数据库
fig = px.scatter_geo(
df, # 数据
locations="iso_alpha", # 配合颜色color显示
color="continent", # 颜色
hover_name="country", # 悬停数据
size="pop", # 大小
animation_frame="year", # 数据帧的选择
projection="orthographic" # 全球地图
)
#定义地图呈现数据
fig.show()
#显示图像
结果如下:
动态效果如下:
代码如下:
import plotly.express as px
#导入第三方库
df=px.data.gapminder()
#导入gaminder地图数据
print(df[0:9])
#输出数据库
fig=px.choropleth(
df, # 数据集
locations="iso_alpha", # 配合颜色color显示
color="lifeExp", # 颜色的字段选择
hover_name="country", # 悬停字段名字
animation_frame="year", # 添加动画注释
color_continuous_scale=px.colors.sequential.Plasma, # 颜色变化
#projection="natural earth" # 全球地图
projection="orthographic"
)
#定义地图呈现数据
fig.show()
#显示图像
结果如下:
Plotly为我们提供了非常便捷的数据可视化工具,就Python平台而言,仅仅通过调用数据和可视化模块,便可实现个性的可视化呈现。随着不断地接触数据可视化相关的内容,我也了解到目前也有很多其他类似的平台能够为我们提供这样的可视化工具,例如flourish、ECharts等等,都能够通过简单的数据上传实现数据的可视化。
同时,通过课上的学习,我也了解到“好数据”的标准是近期、完整、权威,只有这样的数据才能够相对客观、真实地反映出事情的原貌,更有利于保证研究的真实性。