高级可视化神器Plotly玩转散点图

高级可视化神器Plotly玩转散点图

之前介绍过一篇文章介绍酷炫!36张图爱上高级可视化神器Plotly_Express,文章中介绍了大量基于plotly绘制的各种图形,例子多而不精。本文开始将会详细介绍基于Plotly绘制的各种图形,Plotly绘图主要是两个模块:

  • plotly_express,简写为px
  • plotly.graph_objects,简写为go

本文介绍的是如何绘制散点图和折线图,折线图可以说是散点图的一种极限情况。

导入库

import pandas as pd
import numpy as np
import plotly_express as px
import plotly.graph_objects as go

基础散点图

自定义数据

这种散点图应该是最基础的,直接传入x和y的值

fig = px.scatter(x=[0,2,4,6],
                 y=[1,3,5,7]
                )
fig.show()

高级可视化神器Plotly玩转散点图_第1张图片

传入DataFrame型数据

高级可视化神器Plotly玩转散点图_第2张图片

fig = px.scatter(df,  # 数据集
                 x="sepal_width",  # x轴
                 y="sepal_length"  # y轴
                )
fig.show()

高级可视化神器Plotly玩转散点图_第3张图片

同时我们可以传入改变散点颜色和大小的参数:color和size

1、指定颜色

fig = px.scatter(df,  # 数据集
                 x="sepal_width",  # x轴
                 y="sepal_length",  # y轴
                 color="sepal_length"  # 指定颜色
                )
fig.show()

高级可视化神器Plotly玩转散点图_第4张图片

2、指定大小

 fig = px.scatter(df,  # 数据集
                 x="sepal_width",  # x轴
                 y="sepal_length",  # y轴
                 color="species",  # 指定颜色
                 size="sepal_length"  # 指定散点大小
                )
fig.show()

高级可视化神器Plotly玩转散点图_第5张图片

3、同时指定颜色和大小

gap = px.data.gapminder().query("year == 2002")

fig = px.scatter(gap   # 绘图DataFrame数据集
           ,x="gdpPercap"  # 横坐标
           ,y="lifeExp"  # 纵坐标
           ,color="continent"  # 区分颜色
           ,size="pop"   # 区分圆的大小
           ,size_max=60  # 散点大小
          )
fig.show()

高级可视化神器Plotly玩转散点图_第6张图片

散点图显示数据

有时候我们需要将数据显示在每个散点附近:

x_data = [0,2,4,6,8]
y_data = [1,3,5,7,9]

fig = px.scatter(x=x_data,
                 y=y_data,
                 text=x_data  # 设置显示的文本内容
                )
fig.update_traces(textposition="top center")  # 文本显示的位置:顶部居中

fig.show()

高级可视化神器Plotly玩转散点图_第7张图片

绘制线型图

高级可视化神器Plotly玩转散点图_第8张图片

显示图形为:

高级可视化神器Plotly玩转散点图_第9张图片

使用plotly自带的数据集:

df = px.data.carshare()

fig = px.line(df,
              x='centroid_lat',
              y='car_hours',
              color='peak_hour'
             )
fig.show()

高级可视化神器Plotly玩转散点图_第10张图片

gapm = px.data.gapminder().query("continent == 'Oceania'")

fig = px.line(gapm, 
              x='year', 
              y='lifeExp', 
              color='country')
fig.show()

高级可视化神器Plotly玩转散点图_第11张图片

基于go.Scatter绘制散点图

上面介绍的都是基于px来绘制散点图,下面介绍的是如何利用go.Scatter绘制散点图:

基础散点图

import plotly.graph_objects as go
import numpy as np

N = 1000
x = np.linspace(0, 20, 100)
y = np.cos(x)

fig = go.Figure(data=go.Scatter(
    x=x, 
    y=y, 
    mode='markers'))

fig.show()

高级可视化神器Plotly玩转散点图_第12张图片

多个散点图

适合对多组数据进行比较

import plotly.graph_objects as go


import numpy as np
np.random.seed(1)

# 生成随机数据
N = 200
random_x = np.linspace(0, 1, N)
random_y0 = np.random.randn(N) + 10
random_y1 = np.random.randn(N)
random_y2 = np.random.randn(N) - 10

# 准备画布
fig = go.Figure()

# 添加3组不同的数据
fig.add_trace(go.Scatter(  # 
    x=random_x, 
    y=random_y0,               
    mode='lines', # mode模式选择              
    name='lines')) # 名字

fig.add_trace(go.Scatter(
    x=random_x, 
    y=random_y1,           
    mode='lines+markers',              
    name='lines+markers'))

fig.add_trace(go.Scatter(
    x=random_x, 
    y=random_y2,                 
    mode='markers',               
    name='markers'))

fig.show()

高级可视化神器Plotly玩转散点图_第13张图片

冒泡散点图

冒泡散点图是通过每个散点的大小来决定的:

fig = go.Figure(data=go.Scatter(
    x=[1,3,5,7],
    y=[12,18,24,6],
    mode='markers',
    marker=dict(size=[20,40,60,80],  # marker是字典形式的数据
                color=[0,1,2,3]
               )
))

fig.show()

高级可视化神器Plotly玩转散点图_第14张图片

自定义散点颜色

import plotly.graph_objects as go
import numpy as np

# 生成x轴数据
t = np.linspace(0, 10, 200)

# 设置画布
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=t,  # xy轴
    y=np.cos(t),  
    name='cos',  # 名字
    mode='markers',  # 采取显示的形状:markers、lines、markers+lines
    marker_color='rgba(200, 100, 1, 100.8)'  # 通过rgb设置颜色
))

fig.add_trace(go.Scatter(
    x=t, 
    y=np.sin(t),
    name='sin',
    marker_color='rgba(255, 2, 130, .9)'
))


fig.update_traces(mode='markers', 
                  marker_line_width=2, # 标记外围线宽
                  marker_size=10)  # 标记大小


fig.update_layout(title='自定义散点图',   # 图形名称
                  yaxis_zeroline=False, 
                  xaxis_zeroline=False)


fig.show()

高级可视化神器Plotly玩转散点图_第15张图片

设置渐变颜色

import plotly.graph_objects as go
import numpy as np

fig = go.Figure(data=go.Scatter(
    y = np.random.randn(400),
    mode='markers',
    marker=dict(
        size=16,
        color=np.random.randn(400), 
        colorscale='sunsetdark',  # matter picnic sunsetdark thermal
        showscale=True
    )
))

fig.show()

高级可视化神器Plotly玩转散点图_第16张图片

大量数据散点图

当数据量比较大的时候,散点图会显得非常密集:

1、案例1

import numpy as np

N = 100000

fig = go.Figure(data=go.Scattergl(
    x = np.random.randn(N),   # 随机生成100000个数字
    y = np.random.randn(N),
    mode='markers',
    marker=dict(
        color=np.random.randn(N),  # 随机生成100000个颜色
        colorscale='plotly3',
        line_width=1
    )
))

fig.show()

高级可视化神器Plotly玩转散点图_第17张图片

2、案例2

import plotly.graph_objects as go
import numpy as np

N = 100000
r = np.random.uniform(0, 1, N)  # 随机生成0-1之间100000的一个浮点数
theta = np.random.uniform(0, 2*np.pi, N)  # 随机生成0-2*pi之间的100000个浮点数

fig = go.Figure(data=go.Scattergl(
    x = r * np.cos(theta), 
    y = r * np.sin(theta), 
    mode='markers',
    marker=dict(
        color=np.random.randn(N),
        colorscale='magma',
        line_width=1
    )
))

fig.show()

高级可视化神器Plotly玩转散点图_第18张图片

random.uniform()函数的用法:

3D散点图

介绍两种3D散点图:

  • 基于px的3D散点图
  • 基于go的3D散点图

基于plotly_express

1、案例1

import plotly.express as px

df1 = px.data.iris()

fig1 = px.scatter_3d(df1,  # 指定数据
                    x='sepal_length',  # 指定3个轴
                    y='sepal_width', 
                    z='petal_width',
                    color='species')  # 指定颜色
fig1.show()

高级可视化神器Plotly玩转散点图_第19张图片

2、案例2

import plotly.express as px

df2 = px.data.iris()
fig2 = px.scatter_3d(df2, 
                     x='sepal_length',
                     y='sepal_width', 
                     z='petal_width',  
                     color='petal_length', 
                     symbol='species')
fig2.show()

高级可视化神器Plotly玩转散点图_第20张图片

基于go.Figure

1、案例1

import plotly.graph_objects as go
import numpy as np


t = np.linspace(0, 10, 30)   # 0-10之间随机生成50个数字
x, y, z = np.cos(t), np.sin(t), t   # 设置3个变量

fig = go.Figure(data=[go.Scatter3d(x=x, 
                                   y=y, 
                                   z=z,
                                   mode='markers')])
fig.show()

高级可视化神器Plotly玩转散点图_第21张图片

2、案例2

import plotly.graph_objects as go
import numpy as np

t = np.linspace(0, 20, 100)
x, y, z = np.cos(t), np.sin(t), t

fig = go.Figure(data=[go.Scatter3d(
    x=x,
    y=y,
    z=z,
    mode='markers',
    marker=dict(  # 标记设置
        size=12,
        color=z,                
        colorscale='piyg',   # 渐变色选择
        opacity=0.8  # 透明度设置
    )
)])

fig.update_layout(margin=dict(l=0, r=0, b=0, t=0))
fig.show()

高级可视化神器Plotly玩转散点图_第22张图片

一切看似逝去的,都不曾离开,你所给与的爱与温暖,让我执着地守护着这里。

尤而小屋,一个温馨的小屋。小屋主人,一手代码谋求生存,一手掌勺享受生活,欢迎你的光临

你可能感兴趣的:(plotly,数据挖掘,数据可视化,数据分析)