皮卡丘的学习生涯

Python之Matplotlib使用

欢迎关注

微信公众号：想进化的猿

头条号：python进阶者

一、基本步骤

在刚开始接触Matplotlib时，按下列步骤写好注释，再着手写代码，会是一个不错的熟练Matplotlib使用的方法。

# 0、导入包
import matplotlib.pyplot as plt
# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure()
# 3、绘图
ax = fig.add_subplot(111)
ax.plot(x, y)
# 4、自定义设置
ax.set_xlim(1, 5)
# 5、保存图形（按需要使用）
plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

上述例子简单绘制了一条直线，结果如下：

二、常用属性

为了美化我们的图形，我们经常会设置图形的各种属性。

图表属性

在第一步的创建图像方法plt.figure()中，我们可以通过传入参数来改变图像的显示属性。查阅官方文档，figure方法的参数包括figsize、dpi、facecolor、edgecolor、linewidth、frameon、subplotpars、tight_layout、constrained_layout。其中 subplotpars、tight_layout这两个参数与子图相关，暂时不详细展开，其他参数的含义如下：

figsize：图像宽高，单位为英寸。（1英寸等于2.5cm）

dpi：图像分辨率，即每英寸多少个像素，默认值80。

facecolor：图像背景颜色。

edgecolor：图像边框颜色。

linewidth：图像边框线宽。

frameon：是否显示边框。

constrained_layout：是否自动布局，若为True则使用constrained_layout，会自动调整plot的位置。

修改plt.figure()，传入相关参数，代码如下：

import matplotlib.pyplot as plt

# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), 
                 dpi=100, 
                 facecolor=(0,1,0,1), # (0,1,0,1)为颜色属性，四个值分别为r,g,b和透明度
                 edgecolor=(1,0,0,1), 
                 frameon=True, 
                 linewidth=1)
# 3、绘图
ax = fig.add_subplot(111)
ax.plot(x, y)
# 4、自定义设置
ax.set_xlim(1, 5)
# 5、保存图形（按需要使用）
plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行后可以看到如下图表，可以通过调整参数进行尝试熟练各个参数的用法和用途。

坐标属性

在作拥有坐标轴的图表时，我们往往需要对坐标轴进行设置，例如坐标轴的名称、坐标轴的范围、坐标轴的刻度等。下面介绍几种常见的坐标轴设置。

设置坐标轴的名称：plt.xlabel，plt.ylabel分别设置x轴和y轴的标签，这里我们使用ax=fig.add_subplot在figure中分出子图进行操作，故使用ax.set_xlabel，ax.set_ylabel进行设置，后续的属性也都是同一道理。

下面我们给x轴添加标签“x”，给y轴添加标签“y”，代码如下：

# 0、导入包
import matplotlib.pyplot as plt
# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax = fig.add_subplot(111)
ax.plot(x, y)
ax.set_xlabel('x') 
ax.set_ylabel('y')
# 4、自定义设置
ax.set_xlim(1, 5)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行后可以看到，坐标轴已经拥有了标签：

设置坐标轴的范围：plt.xlim, plt.ylim分别设置x轴和y轴的大小范围。另外，plt.xticks, plt.yticks虽然用于设置刻度，但其同样可以用来设置坐标轴的范围。
根据x, y的值我们设置x的范围为1-4，y的范围为10-40。两种设置方式分别如下：

# 0、导入包
import matplotlib.pyplot as plt
# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(8, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax1 = fig.add_subplot(121)
ax1.plot(x, y)
ax2 = fig.add_subplot(122) # 这里为了比较创建两个子图
ax2.plot(x, y)
# 4、自定义设置
ax1.set_title('lim')
ax2.set_title('ticks')
ax1.set_xlabel('x') 
ax1.set_ylabel('y')
ax2.set_xlabel('x') 
ax2.set_ylabel('y')
ax1.set_xlim([1, 4]) # 设置边界
ax1.set_ylim([10, 40])
ax2.set_xticks(range(1, 5)) # 设置刻度
ax2.set_yticks([(i*10) for i in range(1, 5)])
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下，可以看到，使用xlim/ylim设置的时候是严格的范围，而使用xticks/yticks设置的时候边界值上下都会有一定的间隙。

设置坐标轴的刻度：除了上面介绍的xticks/yticks，有时我们会根据需求设置不同的刻度表示形式，例如小数、百分数等等，此时我们使用plt.set_xticklabels/plt.set_yticklabels。假设我们要将上述的横坐标和纵坐标的刻度都用两位小数展示，用法如下：

# 0、导入包
import matplotlib.pyplot as plt

# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax = fig.add_subplot(111)
ax.plot(x, y)
# 4、自定义设置
ax.set_xlabel('x') 
ax.set_ylabel('y')
ax.set_xlim([1, 4]) # 设置边界
ax.set_ylim([10, 40])
ax.set_xticklabels('%.2f' %i for i in range(1, 5)) # 设置刻度表示形式
ax.set_yticklabels('%.21f' %(i*5) for i in range(2, 9))
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下：

线条属性

在第3步绘图的ax.plot()方法中，我们可以通过传入参数来改变线条的显示属性。常见的有color、 marker、linestyle、linewidth等。

color：线条颜色。常用的有r红, g绿, b蓝, c青, m紫红, y黄, k黑, w白。

marker：坐标点标记。

linestyle：线条形状。如"--"，"-", '-.'等。

linewidth：线条宽度。

修改ax.plot()，传入相关参数，代码如下：

# 0、导入包
import matplotlib.pyplot as plt
# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax = fig.add_subplot(111)
ax.plot(x, y, color='y', marker='.', linestyle='--', linewidth=1.5)
# 4、自定义设置
ax.set_xlabel('x') 
ax.set_ylabel('y')
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行后可以看到如下图表，可以通过调整参数进行尝试熟练各个参数的用法和用途。

其他属性

legend：图例。可传参数包括handles，labels，loc等。handles是图线序列，labels是要显示的图例标签，loc是图例显示的位置，共有11种可选，传参时用String或Code均可。

给之前的图简单添加一个图例，位置用best，自适应方式。

# 0、导入包
import matplotlib.pyplot as plt
# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax1 = fig.add_subplot(111)
ax1.plot(x, y)
# 4、自定义设置
ax1.set_xlabel('x') 
ax1.set_ylabel('y')
# 设置边界
ax1.set_xlim([1, 4])
ax1.set_ylim([10, 40])
# 设置图例
ax1.legend(['legend'], loc=0)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

效果如下。当然，legend还有很多可选参数，在日后的学习工作中遇到了再记录。

grid：给图表添加网格。可传参数包括b, which, axis和其他可选参数。b是否显示网格线，当提供color，linestyle等可选参数时，会默认b为True。which应用网格线，可传'major', 'minor', 'both'分别表示使用主刻度、次刻度、两者。axis应用轴，可传 'x', 'y', 'both'分别表示使用x轴、y轴、两者。可选参数包括color、linestyle、linewidth等。下面添加一个简单的网格线：

# 0、导入包
import matplotlib.pyplot as plt
# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax1 = fig.add_subplot(111)
ax1.plot(x, y)
# 4、自定义设置
ax1.set_xlabel('x') 
ax1.set_ylabel('y')
# 设置边界
ax1.set_xlim([1, 4])
ax1.set_ylim([10, 40])
# 设置图例
ax1.legend(['legend'], loc=0)
# 添加网格线（使用主次刻度需要先设置，这里暂时忽略，直接用both）
ax1.grid(True, which='both', axis='both', color='y', linestyle='--', linewidth=1)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

结果如下：

MultipleLocator, FormatStrFormatter：修改主次刻度。主刻度和次刻度就类似于一把直尺上cm与mm的关系。MultipleLocator生成刻度标签，FormatStrFormatter生成刻度标签格式，然后分别用set_major_locator、set_major_formatter、set_minor_locator、set_minor_formatter进行主次刻度的设置。下面对x轴进行主次刻度的设置：

# 0、导入包
import matplotlib.pyplot as plt
from matplotlib.ticker import MultipleLocator, FormatStrFormatter
# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax1 = fig.add_subplot(111)
ax1.plot(x, y)
# 4、自定义设置
ax1.set_xlabel('x') 
ax1.set_ylabel('y')
# 设置边界
ax1.set_xlim([1, 4])
ax1.set_ylim([10, 40])
# 设置图例
ax1.legend(['legend'], loc=0)
# 设置主刻度 次刻度
x_major_locator = MultipleLocator(1) #将x轴主刻度标签设置为1的倍数
ax1.xaxis.set_major_locator(x_major_locator)
x_major_formatter = FormatStrFormatter('%.0f') #设置x轴标签文本的格式
ax1.xaxis.set_major_formatter(x_major_formatter)
x_minor_locator = MultipleLocator(0.5) #将x轴次刻度标签设置为0.5的倍数ax.xaxis.set_minor_locator(xminorLocator)
ax1.xaxis.set_minor_locator(x_minor_locator)
# 添加网格线
ax1.grid(True, which='both', axis='both', color='y', linestyle='--', linewidth=1)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

结果如下。可以看到x轴上1.5、2.5、3.5的位置上已经出现了次刻度。

text：在坐标上添加文本，参数有x，y，s，fontdict，withdash。x，y是放置文本的位置。s是要添加的文本。fontdict用于覆盖默认文本属性的字典，例如fontsize等，如果fontdict为none，则默认值由rc参数（matplotlib.rcParams）决定。withdash创建一个TextWithDash实例用于代替Text实例。下面我们在(2, 20)这个位置添加一个文本。

# 0、导入包
import matplotlib.pyplot as plt
# 1、准备数据
x = [1, 2, 3, 4]
y = [10, 20, 30, 40]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax1 = fig.add_subplot(111)
ax1.plot(x, y)
# 4、自定义设置
ax1.set_xlabel('x') 
ax1.set_ylabel('y')
# 设置边界
ax1.set_xlim([1, 4])
ax1.set_ylim([10, 40])
# 设置图例
ax1.legend(['legend'], loc=0)
# 添加网格线
ax1.grid(True, which='both', axis='both', color='y', linestyle='--', linewidth=1)
# 添加注释
plt.text(2, 20, 'text', fontsize=10)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

结果如下：

最后再简单介绍几个比较常用的属性方法，matplotlib.rcParams['xtick_direction'] 、matplotlib.rcParams['ytick.direction']可以设置刻度的方向，rcParams是pylot使用rc配置文件来自定义图形各种默认属性的方法，也叫rc配置或rc参数，通过rc参数可以修改图表的默认属性，包括窗体大小、每英寸的点数、线条宽度、颜色、样式、坐标轴、坐标和网络属性、文本、字体等。plt.axis('off')可以关闭坐标轴，如果想只关闭x轴或y轴，可以使用frame = plt.gca()获取当前子图，然后用frame.axes.get_xaxis().set_visible(False)或frame.axes.get_yaxis().set_visible(False)对x轴或y轴设置是否显示。

三、子图

在Matplotlib中，整个图像就是一个Figure对象，在Figure对象中可以包含一个或多个Axes对象，而每个Axes对象都是拥有自己的坐标系系统的绘图区域。在同一个Figure图像下的每个图表都代表这个图像的一个子图。

子图的创建方法

常用的子图创建方法一般有三种。

第一种，利用Figure对象的add_subplot方法生成子图然后再向其中填充图表。add_subplot方法的参数包括nrows, ncols, index以及可选参数。其中nrows, ncols是子图的行列大小，index是当前创建的子图的索引，即作为图像的第几个子图。

为了更好地展示图表，用到了numpy和pandas来创建数据。首先创建一个2*2共4个子图区域的图像，然后向其中的3个子图区域填充图表。注意，这里创建的4个区域只是占位符，不一定要去填充，而且不一定要根据顺序去填充。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data1 = np.random.rand(100).cumsum()
data2 = 50-np.random.rand(100).cumsum()
# 2、创建图像
fig = plt.figure(figsize=(6, 6), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = fig.add_subplot(2, 2, 1)
ax1.plot(data1)
ax2 = fig.add_subplot(2, 2, 2)
ax2.plot(data2)
ax3 = fig.add_subplot(2, 2, 3)
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
ax3.plot(df)
# 4、自定义设置
ax1.set_title("No.1")
ax2.set_title("No.2")
ax3.set_title("No.3")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行后可以看到，在左上、右上、左下三个位置分别生成了图表，当然我们也可以根据需要或自己的喜好在4个子图区域中随意选择摆放图表的位置。

第二种，使用plt.add_subplots方法同时生成Figure对象和axes对象数组，每个axes对象就相当于一个子图。add_subplots方法的参数包括nrows, ncols, sharex, sharey, squeeze, subplot_kw, gridspec_kw。其中nrows, ncols就是子图的行列大小，共生成nrows*ncols个子图。sharex, sharey设置是否共享x轴或y轴，默认不共享。squeeze默认True，挤压多余尺寸，一般默认即可。subplot_kw、gridspec_kw可选参数，用来设置子图的属性。

首先使用subplots方法得到axes对象数组，然后分别取出相应子图进行设置，同样，这里创建的axes也只是占位符。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data1 = np.random.rand(100).cumsum()
data2 = 50-np.random.rand(100).cumsum()
# 2、创建图像
fig, axes = plt.subplots(2, 2, figsize=(6, 6), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = axes[0, 0]
ax1.plot(data1)
ax2 = axes[0, 1]
ax2.plot(data2)
ax3 = axes[1, 0]
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
ax3.plot(df)
# 4、自定义设置
ax1.set_title("No.1")
ax2.set_title("No.2")
ax3.set_title("No.3")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下图所示。可以看到，与之前先生成子图区域再填充的方法相比，生成axes数组会将坐标轴事先生成，即使不向其中添加图表，坐标轴也会展示在相应的位置。

第三种，利用pandas的DataFrame生成多系列图，然后拆分成子图。上述两种创建子图方法中的第三个子图都使用了pandas创建数据并在图表中展示了4条折线。这里我们依旧使用这个pandas数据，然后进行拆分直接生成子图。

# 导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 准备数据
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
# 拆分生成子图
df.plot(figsize=(6, 6), subplots=True, layout=(2, 2))
plt.show()

运行效果如下。这种拆分方式生成的子图默认就有图例，并共用了一个x轴。

在前两种子图创建方法中，我们发现各个子图之间的间距非常小，尤其是垂直方向上的间距，看着很不舒服，我们使用subplots_adjust方法来调整子图间的间距，subplots_adjust方法接收wspace, hspace两个参数分别表示水平方向和垂直方向上的间距。以第二种方法为例，我们向其中加入subplots_adjust方法。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
# 1、准备数据
data1 = np.random.rand(100).cumsum()
data2 = 50-np.random.rand(100).cumsum()
# 2、创建图像
fig, axes = plt.subplots(2, 2, figsize=(6, 6), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = axes[0, 0]
ax1.plot(data1)
ax2 = axes[0, 1]
ax2.plot(data2)
ax3 = axes[1, 0]
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
ax3.plot(df)
# 4、自定义设置
ax1.set_title("No.1")
ax2.set_title("No.2")
ax3.set_title("No.3")
# 调整子图间间距
plt.subplots_adjust(wspace=0.2, hspace=0.4)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

再次运行后可以看到，各个子图之间已经不再那么拥挤了。

内嵌图

除了像子图这种图表比较外，我们有时候也常常在已有的图表中再生成图表来进行比较，这种方式就叫做内嵌。

# 0、导入包
import matplotlib.pyplot as plt
# 1、准备数据
x = [1, 2, 3, 4]
y1 = [10, 20, 30, 40]
y2 = [40, 30, 20, 10]
# 2、创建图像
fig = plt.figure(figsize=(3, 3), dpi=100, facecolor=(0,1,0,1),
    edgecolor=(1,0,0,1), frameon=True, linewidth=1)
# 3、绘图
ax1 = fig.add_axes([0.1, 0.1, 0.8, 0.8])
# 在ax1中内嵌
ax2 = fig.add_axes([0.2, 0.6, 0.25, 0.25])
# 4、自定义设置
ax1.plot(x, y1, 'r')
ax1.set_title('No.1')
ax2.plot(x, y2, 'b')
ax2.set_title('No.2')
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下：

四、基本图表

线状图

线状图又称为曲线图，是最简单的图形。这种图形清楚地记录变动过程，以点标示变化，并连点成线。在Matplotlib中，plot方法默认生成的就是线状图。

# 0、导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 1、准备数据
data = pd.Series(np.random.randn(10))
# 2、创建图像
fig = plt.figure(figsize=(5, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
ax.plot(data)
# 4、自定义设置
ax.set_xlabel('x')
ax.set_ylabel('y')
# 5、保存图像
# plt.savefig('xxx.png')
# 6、显示图像
plt.show()

利用Pandas的Series方法生成一组数据，然后读取后使用plot方法直接生成线状图，运行结果如下：

柱状图

柱状图是一种以长方形的长度为变量的图表，由一系列高度不等的纵向条纹表示数据分布的情况，可以用来同时比较多个事物的变化，通常利用于较小的数据集分析。在Matplotlib中，柱状图的创建方法有两种：plot(kind='bar')或plot.bar()。

首先看第一种方法，我们分别创建一个单系列柱状图和多系列柱状图。

# 0、导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 1、准备数据
data1 = pd.Series(np.random.randn(10))
data2 = pd.DataFrame(np.random.rand(10, 4), columns=list('abcd'))
# 2、创建图像
fig, axes = plt.subplots(1, 2, figsize=(12, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = axes[0]
ax2 = axes[1]
data1.plot(kind='bar', ax=ax1)
data2.plot(kind='bar', ax=ax2)
# 4、自定义设置
ax1.set_title('No.1')
ax2.set_title('No.2')
# 5、保存图像
# plt.savefig('xxx.png')
# 6、显示图像
plt.show()

利用Pandas的Series和DataFrame方法分别生成一组单系列数据和多系列数据，然后使用plot(kind='bar')创建柱状图。运行结果如下图所示。如果创建的时候未指定color属性，柱状图的颜色是随机生成的。在多系列柱状图中，会自动显示图例。

第二种方法只需要将上面代码中的data1.plot(kind='bar', ax=ax1)、data2.plot(kind='bar', ax=ax2)改成data1.plot.bar(ax=ax1)、data2.plot.bar(ax=ax2)就可以了。

柱状图除了纵向排列外，有时也会用到横向排列进行比较。要使用横向排列只需要将kind='bar'或bar()换成kind='barh'或barh()即可，这里以barh()为例。

# 0、导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 1、准备数据
data1 = pd.Series(np.random.randn(10))
data2 = pd.DataFrame(np.random.rand(10, 4), columns=list('abcd'))
# 2、创建图像
fig, axes = plt.subplots(1, 2, figsize=(12, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = axes[0]
data1.plot.barh(ax=ax1)
ax2 = axes[1]
data2.plot.barh(ax=ax2)
# 4、自定义设置
# 5、保存图像
# plt.savefig('xxx.png')
# 6、显示图像
plt.show()

运行后柱状图就变成横向展示了。

柱形图还可以设置成堆叠的形式，我们将上述的多系列柱状图修改成堆叠形式，只需要将stacked属性设置成True即可。

# 0、导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 1、准备数据
data = pd.DataFrame(np.random.rand(10, 4), columns=list('abcd'))
# 2、创建图像
fig = plt.figure(figsize=(5, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
data.plot.bar(ax=ax, stacked=True)
# 4、自定义设置
ax.set_xlabel('x')
ax.set_ylabel('y')
# 5、保存图像
# plt.savefig('xxx.png')
# 6、显示图像
plt.show()

堆叠后同一个分类下的数据不再是依次排列而是依次从上到下堆叠在一起。

柱状图的主要作用是比较数据，观察柱状图的高度就可以判断数据的大小，但有时候两组数据非常接近时，肉眼无法通过观察高度判断大小，这时我们可以通过text()给柱状图添加文本。

# 0、导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 1、准备数据
x = np.arange(10)
y = np.random.rand(10)
# 2、创建图像
fig = plt.figure(figsize=(5, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
ax.bar(x, y, width=1, facecolor='yellowgreen', edgecolor='white')
# 4、自定义设置
ax.set_xlabel('x')
ax.set_ylabel('y')
for i, j in zip(x, y):
    ax.text(i, j, '%.2f'%j, ha='center', va='bottom', fontsize=7)
# 5、保存图像
# plt.savefig('xxx.png')
# 6、显示图像
plt.show()

通过for循环给每个柱体添加值，i，j确定文本位置，然后设置文本显示格式，ha和va分别表示水平和垂直方向上的显示方式，fontsize设置字体大小，还可以根据喜好设置字体颜色等。

直方图

直方图又称为质量分布图，由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型，纵轴表示分布情况。直方图跟柱状图很类似，通常也可以将直方图当作是柱状图的一种，但柱状图主要用来比较数据的大小，而直方图的主要目的是展示数据的分布。

和柱状图一样，直方图也可以通过plot(kind='hist')或plot.hist()两种方法进行创建，我们以plot.hist()为例。

# 0、导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 1、准备数据
data = pd.Series(np.random.randn(1000))
# 2、创建图像
fig = plt.figure(figsize=(5, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
data.hist(ax=ax, bins=20, histtype='bar', align='mid', orientation='vertical', normed=True)
# data.plot(kind='kde', style='k--')
# 4、自定义设置
ax.set_title('hist')
# 5、保存图像
# plt.savefig('xxx.png')
# 6、显示图像
plt.show()

bins表示边数，给定bins，返回bins+1条边，也即bins个矩形。histtype是直方图的类型，共有四种，bar传统条形直方图，barstacked堆叠条形直方图，step未填充的线图，stepfilled填充的线图，默认为bar。align设置直方图的对齐方式。orientation设置直方图纵向vertical或横向horizontal展示。normed是标准化，将数据标准化为0-1之间的数。

直方图同样也可以堆叠，方法与柱状图一样，只要设置stacked属性为True即可。

# 0、导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 1、准备数据
data = pd.DataFrame(np.random.randn(1000, 4), columns=list('abcd'))
# 2、创建图像
fig = plt.figure(figsize=(5, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
data.plot.hist(ax=ax, stacked=True, bins=20, histtype='bar', align='mid', orientation='vertical')
# 4、自定义设置
ax.set_title('hist')
# 5、保存图像
# plt.savefig('xxx.png')
# 6、显示图像
plt.show()

运行结果如下。

密度图

密度图是一种表现与数据值对应的边界或域对象的理论图形表示方法，一般用于呈现连续变量。在图表展示中，密度图通常会与直方图一起出现进行展示。密度图用plot(kind='kde')或plot.kde()创建。

# 0、导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 1、准备数据
data = pd.Series(np.random.randn(1000))
# 2、创建图像
fig = plt.figure(figsize=(5, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
data.plot.hist(ax=ax, bins=20, histtype='bar', align='mid', orientation='vertical', normed=True)
data.plot.kde(ax=ax, ylim=(0, 1), style='k--')
# 4、自定义设置
ax.set_title('hist')
# 5、保存图像
# plt.savefig('xxx.png')
# 6、显示图像
plt.show()

运行后可以看到，密度图反映了我们创建的数据是服从正态分布的。

面积图

面积图又称为区域图，强调数量随时间而变化的程度，也可用于引起人们对总值趋势的注意。堆积面积图和百分比堆积面积图还可以显示部分与整体的关系。Matplotlib中，使用area()方法创建面积图，基本用法如下。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data = pd.DataFrame(np.random.rand(10, 5), columns=list('abcde'))
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
data.plot.area(ax=ax) # colormap='Greens_r'
# 4、自定义设置
ax.set_title("area")
ax.set_xlim(0, 8)
ax.set_ylim(0, 4)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下，由于没有设置颜色，每个图形呈现的颜色是随机的，设置色系可使用colormap属性。在Matplotlib中，面积图默认是堆叠的，即stacked值默认为True。

若不想堆叠显示，可以将stacked值设为False。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data = pd.DataFrame(np.random.rand(10, 5), columns=list('abcde'))
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
data.plot.area(ax=ax, stacked=False)
# 4、自定义设置
ax.set_title("area")
ax.set_xlim(0, 8)
ax.set_ylim(0, 1)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

设置面积图不堆叠后，呈现效果跟下面讲到的填充图的重叠很像，运行效果如下图所示。

填充图

填充图用于基本图表的填充，分为多边形填充（简单来说，就是填充函数和坐标轴之间的区域）和函数间区域填充。Matplotlib中，分别用fill(*args, **kwargs)和fill_between()来实现多边形填充和函数间区域填充。

多边形填充fill(*args, **kwargs)中，args参数是x, y的序列，以及可选的color参数。kwargs是图形的可选属性参数，例如标签label，透明度alpha等。用法如下。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
x = np.linspace(0, 1, 1000)
y1 = np.sin(3 * np.pi * x) * np.exp(2 * x)
y2 = -np.sin(3 * np.pi * x) * np.exp(2 * x)
# 2、创建图像
fig, axes = plt.subplots(2, 2, figsize=(8, 8), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = axes[0, 0]
ax2 = axes[0, 1]
ax3 = axes[1, 0]
ax4 = axes[1, 1]
ax1.fill(x, y1, label='y1')
ax2.fill(x, y2, 'r', alpha=0.5, label='y2')
ax3.fill(x, y1, x, y2)
ax4.fill(x, y1, 'r', x, y2, 'b')
# 4、自定义设置
ax1.set_title("No.1")
ax1.legend(loc=0)
ax2.set_title("No.2")
ax2.legend(loc=2)
ax3.set_title("No.3")
ax4.set_title("No.4")
plt.subplots_adjust(wspace=0.1, hspace=0.3)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

上述代码创建了4个填充图，分别是使用默认颜色填充一个图形，使用红色填充一个图形，使用默认颜色填充两个图形，使用红色和蓝色填充两个图形。运行结果如下。

当图形多于一个时添加图例，我们可以使用两次fill()方法，分别设置对应的图例名称。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
x = np.linspace(0, 1, 1000)
y1 = np.sin(3 * np.pi * x) * np.exp(2 * x)
y2 = -np.sin(3 * np.pi * x) * np.exp(2 * x)
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
ax.fill(x, y1, 'r', label='y1')
ax.fill(x, y2, 'b', label='y2')
# 4、自定义设置
ax.legend(loc=2)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行效果如下。

当图形之间有重叠时，填充图的呈现效果就类似于不堆叠的面积图。我们在上述代码的基础上再添加一个填充图，为了便于观察重叠部分，我们将y3的透明度值设置成0.5。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
x = np.linspace(0, 1, 1000)
y1 = np.sin(3 * np.pi * x) * np.exp(2 * x)
y2 = -np.sin(3 * np.pi * x) * np.exp(2 * x)
y3 = -np.sin(2 * np.pi * x) * np.exp(3 * x)
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
ax.fill(x, y1, 'r', label='y1')
ax.fill(x, y2, 'b', label='y2')
ax.fill(x, y3, 'c', alpha=0.5, label='y3')
# 4、自定义设置
ax.legend(loc=2)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行效果如下，可以看到基本与不设置堆叠的面积图一样，重叠部分的颜色效果是由重叠的各个图形颜色叠加生成。

函数间区域填充fill_between()常用的参数包括x, y1, y2, where等。x, y1, y2分别表示了两条曲线，where是条件表达式，可以排除一些不想被包括的区域。此外，还可以传入可选的属性参数。fill_between基本用法如下。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
x = np.linspace(0, 1, 1000)
y1 = -np.sin(3 * np.pi * x) * np.exp(2 * x)
y2 = -np.sin(2 * np.pi * x) * np.exp(3 * x)
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
ax.fill_between(x, y1, y2, facecolor="b")
# 4、自定义设置
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下图所示。

饼图

饼图是显示一个数据系列中各项数据的大小与各项数据总和的比例的一种图表。饼图中的数据点显示为整个饼图的百分比。Matplotlib中，饼图使用pie()方法实现。pie()的参数包括x, explode, labels, colors, autopct, pctdistance, shadow, labeldistance, startangle, radius, counterclock, wedgeprops, textprops, center, frame, rotatelabels。

各参数意义：x是绘制饼图所用的数据。explode是每部分相对于半径的偏移量。labels是每部分标签的字符串序列。colors是饼图循环使用的颜色参数序列。autopct是饼图上的标签显示方式。pctdistance是每个饼图切片的中心与通过autopct生成的文本开始之间的比例。shadow可以设置在饼图下画一个阴影。labeldistance是饼图标签的径向距离。startangle是开始角度（从X轴逆时针旋转饼图的起点角度）。radius是饼图的半径，默认为1。counterclock指定顺时针或逆时针。wedgeprops是传递给饼图对象的参数字典。textprops是传递给文本对象的参数的dict。center设置图表的中心位置。frame为True使用图表绘制轴框架。rotatelabels为True将每个标签旋转到相应切片的角度。

绘制数据x的饼图。每个楔块的分数区域由x/sum(x)给出。如果sum(x)<1，则x的值将直接给出分数区域，且数据x将不规范化，生成的饼图将有一个大小为1-x/sum(x)的空楔块。我们分别绘制sum(x)>1和sum(x)<1两种情况下的饼图，为了比较一些属性，第二个饼图我们取消偏移量，同时设置成顺时针方向。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data1 = pd.Series(3 * np.random.rand(4), index=list('abcd'), name='index')
data2 = [0.15, 0.30, 0.25, 0.10]
# 2、创建图像
fig, axes = plt.subplots(1, 2, figsize=(5, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = axes[0]
ax1.pie(data1, explode=[0.1, 0, 0, 0], labels=data.index, 
        colors=['r', 'g', 'b', 'c'], autopct='%.2f%%', 
        pctdistance=0.6, labeldistance=1.1, 
        shadow=True, startangle=0, radius=1.5, frame=False)
ax2 = axes[1]
ax2.pie(data2, labels=data.index, colors=['r', 'g', 'b', 'c'], 
        autopct='%.2f%%', pctdistance=0.6, labeldistance=1.1, 
        counterclock=False, shadow=True, startangle=0, radius=1.5, frame=False)
# 4、自定义设置
ax1.set_title("Pie1")
ax2.set_title("Pie2")
plt.subplots_adjust(wspace=0.5)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行效果如下图所示，可以看到，第二个饼图由于sum(x)<1，不再以x/sum(x)给出每部分，而是直接用了x的值，并且会空出一块。

饼图还可以进行嵌套，即嵌套饼图。在这种情况下，饼图采用与组中的计数相对应的值。我们首先生成一些对应于三个组的假数据，在外环中，我们将它们绘制为原始3个组的成员，然后在内环中，我们把每个数字视为属于自己的组。用法如下。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
size = 0.3
vals = np.array([[60., 32.], [37., 40.], [29., 10.]])
cmap = plt.get_cmap("tab20c")
outer_colors = cmap(np.arange(3)*4)
inner_colors = cmap(np.array([1, 2, 5, 6, 9, 10]))
# 2、创建图像
fig, ax = plt.subplots(1, 1, figsize=(6, 6), facecolor=(0, 1, 0, 1))
# 3、绘图
ax.pie(vals.sum(axis=1), radius=1+size, colors=outer_colors, autopct='%.2f%%',
       wedgeprops=dict(width=size, edgecolor='w'))
ax.pie(vals.flatten(), radius=1-size, colors=inner_colors, autopct='%.2f%%',
       wedgeprops=dict(width=size, edgecolor='w'))
# 4、自定义设置
ax.set(aspect="equal", title='Pie plot with `ax.pie`')
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

为了便于比较，我们将外环的radius设置成1.3，将内环的radius设置成0.7。这里利用了numpy数组的sum()方法和flatten()方法，sum()设置axis=1对行方向上求和，得到外环的数据，flatten()方法将二维数组降成一维得到内环的数据。运行结果如下图所示。

散点图

散点图是指在回归分析中，数据点在直角坐标系平面上的分布图。散点图表示因变量随自变量变化的大致趋势，据此可以选择合适的函数对数据点进行拟合。散点图通常用两组数据构成多个坐标点，考察坐标点的分布，判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点，值由点在图表中的位置表示，类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据。

Matplotlib中，散点图用scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, data=None, **kwargs)方法创建。各常用参数意义如下。

x, y：绘制散点图的数据点。

s：可选参数。散点的大小，为一个实数或数组。默认大小为20。

c：可选参数。散点图的颜色序列。这里要注意c不是一个单一的RGB或RGBA序列，而是一个RGB或RGBA的二维数组。

marker：可选参数。散点图的散点样式，可选样式可参考之前介绍Matplotlib属性时的相关内容。

cmap：可选参数。颜色映射实例或注册的颜色映射名称。只有当c是一个浮点数组时，才使用cmap。

norm：可选参数。若为True，则将数据正则化为0-1之间的数。

vmin, vmax：可选参数。数据边界化，但是若norm已设置为True，则参数无效。

alpha：可选参数。设置散点透明度。

linewidths：可选参数。标记点的长度。

edgecolors：可选参数。颜色或颜色序列，标记边缘颜色。

绘制散点图用法如下。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
x = np.random.randn(1000)
y = np.random.randn(1000)
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
ax.scatter(x, y, marker='.')
# 4、自定义设置
ax.set_title("scatter")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

上述代码绘制了一个简答的散点图，运行结果如下图所示。

通过修改属性参数，可以绘制各种样式的散点图。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
x = np.random.randn(200)
y = np.random.randn(200)
# 2、创建图像
fig, axes = plt.subplots(2, 2, figsize=(6, 6), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = axes[0, 0]
ax1.scatter(x, y, marker='.', s=10)
ax2 = axes[0, 1]
ax2.scatter(x, y, marker='.', s=60, c=x, alpha=0.8)
ax3 = axes[1, 0]
ax3.scatter(x, y, marker='^', c=x)
ax4 = axes[1, 1]
ax4.scatter(x, y, marker='.', s=np.random.randn(1000)*100, c=x, edgecolors=(1, 0, 0, 1))
# 4、自定义设置
ax1.set_title("scatter1")
ax2.set_title("scatter2")
ax3.set_title("scatter3")
ax4.set_title("scatter4")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

上述代码绘制了4个散点图。图1设置散点的大小s=10小于默认值；图2设置散点的大小s=60大于默认值，同时将numpy数组x作为颜色数组传入c，并设置透明度alpha=0.8；图3设置散点的样式为三角形；图4将s将散点的大小s设置成随机数数组，同时设置散点的边颜色edgecolors。运行效果如下图所示。

有时我们会需要考察多个变量之间的相关关系，我们可以使用散点图矩阵。由于Matplotlib中没有介绍到散点图矩阵，我们借用pandas来实现，另一个绘制图表库seaborn中有专门的绘制散点图矩阵的方法，如果有机会介绍我们再详细展开。pandas中通过scatter_matrix()方法实现散点图矩阵。scatter_matrix()方法接收数据，主要参数为diagonal，只能传hist或kde，hist为直方图表示方式，kde为密度图表示方式，此外还可传marker, alpha等相关属性参数。基本用法如下。

# 导入包
import numpy as np
import pandas as pd
# 准备数据
data = pd.DataFrame(np.random.randn(200, 3), columns=list('abc'))
# 绘制图表
pd.plotting.scatter_matrix(data, marker='.', diagonal='hist') # diagonal还可以传kde，只能二选一

我们以hist直方图表示方式为例，运行结果如下。

。

设置中文

在Matplotlib的使用中，如果给图表添加中文，我们会发现出现了乱码。我们给图表标题设置一个中文名称。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
x = np.random.randn(1000)
y = np.random.randn(1000)
# 2、创建图像
fig = plt.figure(figsize=(5, 5), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111)
ax.scatter(x, y, marker='.', s=np.random.randn(1000)*100, c=y, alpha=0.8)
# 4、自定义设置
ax.set_title("散点图")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行后发现无法正常显示，所有中文都变成了一个个的小框框。

解决方法如下。

1、找到matplotlibrc文件所在路径，使用matplotlib的matplotlib_fname方法可以获取。

import matplotlib as mpl
print(mpl.matplotlib_fname())

进入matplotlibrc所在目录，该目录下会有如下内容。

2、下载中文字体包，这里我们用简体中文字体包（SimHei.ttf），可以用下面给出的下载链接进行下载。将下载好的字体包放入上述目录的fonts文件夹下。

简体中文字体包下载链接: https://pan.baidu.com/s/1soOXkgCVkl125CquOpOHCQ 提取码: 6rcp

3、打开matplotlibrc文件，全局搜索找到font.family、font.sans-serif两个地方，然后去掉注释，即前面的“#”，并在font.sans-serif后面添加我们要加入的字体，这里我们添加SimHei。再全局搜索找到axes.unicode_minus，去掉注释，并将True改成False，最后保存退出。

4、清除缓存。mac用户直接在“/User/当前用户名”下，Windows用户在“C:/用户/当前用户名”下，找到.matplotlib文件夹，直接删除它即可。

5、如果使用Jupyter，需要先重启。然后再重新运行代码，即可正常显示中文，效果如下。

极坐标图

有些几何轨迹问题如果用直角坐标法来处理会比较困难，极坐标法就在基于此之上应运而生。许多直角坐标法难以处理的问题换用极坐标法来处理就会相对简单许多，作图也会比较方便。

在平面内取定点O，称为极点，引一条射线Ox，称为极轴，再选定一个长度单位和角度的正方向（通常取逆时针方向）。对于平面内任何一点M，用ρ或r表示线段OM的长度，称为极径，θ表示从Ox到OM的角度，称为极角，有序数对(ρ,θ)就叫点M的极坐标，这样建立的坐标系就是极坐标系。在极坐标系下的图表就是极坐标图。

在Matplotlib中，直角坐标系换成极坐标系只需要在创建子图的时候设置参数projection='polar'或polar=True即可。下面我们简单看一下极坐标图。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data = pd.Series(np.arange(10))
# 2、创建图像
fig = plt.figure(figsize=(10, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = fig.add_subplot(121)
ax1.plot(data, linestyle='-', marker='.', linewidth=1)
ax2 = fig.add_subplot(122, projection='polar')
ax2.plot(data, linestyle='-', marker='.', linewidth=1)
# 4、自定义设置
ax1.set_title("直角坐标系")
ax2.set_title("极坐标系\n")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

为了便于比较，我们让同一组数据分别绘制在直角坐标系和极坐标系下，运行后效果如下，可以看到极坐标系下的角度正方向默认是逆时针方向。

下面我们看一下极坐标图的一些常用属性。set_rmax()，set_rmin()，set_rlim()分别设置显示的极径最大值最小值以及极径显示范围。修改极坐标系下的角度方向用set_theta_direction()，默认为逆时针，传-1时修改为顺时针方向。set_thetagrids()、set_rgrids()分别设置极坐标角度线和极径网格线，其中极径网格线的参数必须是正数。set_theta_offset()设置角度偏移，按逆时针方向，例子中我们设置偏移π/2，即逆时针方向旋转90度。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
theta = np.arange(0, 2*np.pi, 2*np.pi/8)  # 角度数据
radius = np.arange(1,9,1)  # 极径数据
# 2、创建图像
fig = plt.figure(figsize=(10, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = fig.add_subplot(121, projection='polar')
ax1.plot(theta, radius, '-')
ax2 = fig.add_subplot(122, polar=True)
ax2.plot(theta, radius, '-', linewidth=2)
# 4、自定义设置
ax1.set_title("No.1\n")
ax1.set_rmax(9) # 设置显示的极径最大值
ax2.set_title("No.2\n")
ax2.set_theta_direction(-1) # 坐标轴方向 默认逆时针 -1为顺时针
ax2.set_thetagrids(np.arange(0.0, 360.0, 90), list('abcd')) # 设置极坐标角度线显示及标签 网格和标签数量一致
ax2.set_rgrids(np.arange(0, 9, 2)) # 设置极径网格线显示 其中参数必须是正数
ax2.set_theta_offset(np.pi/2) # 设置角度偏移 逆时针 弧度制
ax2.set_rlim(0, 9) # 设置显示的极径范围
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

创建两个子图，我们给图二设置各种属性，对比效果如下。

极坐标图还可以将坐标系设置成扇形和环形。设置扇形使用set_thetamin()和set_thetamax()指定截取角度，按逆时针方向，例子中我们截取45度~135度的区域。设置环形使用set_rorigin()，设置起点与极点之间的距离，传入负数。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
theta = np.arange(0, 2*np.pi, 2*np.pi/8)  # 角度数据
radius = np.arange(1,9,1)  #极径数据
# 2、创建图像
fig = plt.figure(figsize=(10, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = fig.add_subplot(121, projection='polar')
ax1.plot(theta, radius, '-')
ax2 = fig.add_subplot(122, polar=True)
ax2.plot(theta, radius, '-', linewidth=2)
# 4、自定义设置
ax1.set_thetamin(45)
ax1.set_thetamax(135)
ax2.set_rorigin(-3)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行效果如下图所示。

使用fill()方法可以对极坐标图进行填充，如果想让折线首尾相连，我们可以给数据组添加第一个数据。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
theta = np.arange(0, 2*np.pi, 2*np.pi/10)
radius = np.arange(1, 11, 1)
# 2、创建图像
fig = plt.figure(figsize=(8, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = fig.add_subplot(121, projection='polar')
ax1.plot(theta, radius, '.-')
ax1.fill(theta, radius1, alpha=0.5) # 填充
ax2 = fig.add_subplot(122, projection='polar')
theta = np.append(theta, theta[0])
radius = np.append(radius, radius[0])
ax2.plot(theta, radius, '.-')
ax2.fill(theta, radius, alpha=0.5)
# 4、自定义设置
ax1.set_rlim(0, 10)
ax2.set_rlim(0, 10)
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行后效果如下，为了便于观察，我们将透明度设置为0.5。

极区图

极区图又叫南丁格尔玫瑰图，是一种圆形的柱状图或直方图，形状上看很像是半径不等的扇形图。Matplotlib中使用极区图可以看成是在极坐标系下创建柱状图，即创建子图时设置projection='polar'，然后调用ax.bar()，具体用法如下，作为对比，我们同时创建一个折线的极坐标图。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
theta = np.arange(0, 2*np.pi, 2*np.pi/10)
radius = np.random.randint(0, 10, 10)
# 2、创建图像
fig = plt.figure(figsize=(8, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = fig.add_subplot(121, projection='polar')
bar = ax1.bar(theta, radius, alpha=0.5)
for r, bar in zip(radius, bar):
    bar.set_facecolor(plt.cm.jet(r/10)) # 设置颜色
ax2 = fig.add_subplot(122, projection='polar')
ax2.plot(theta, radius)
# 4、自定义设置
ax1.set_title("极区图\n")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下图所示。

极散点图

极散点图就是在极坐标系下的散点图。散点图主要用来探索变量之间存在的关联性，有时直角坐标系下观察不出的关系换到极坐标系下或许就会比较明朗了。基本使用方法如下。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
N = 150
r = 2 * np.random.rand(N)
theta = 2 * np.pi * np.random.rand(N)
area = 50 * r**2
colors = theta
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax = fig.add_subplot(111, polar=True)
ax.scatter(theta, r, c=colors, s=area, cmap='hsv', alpha=0.75)
# 4、自定义设置
ax.set_title("极散点图\n")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下图所示。

箱形图

箱形图又称为盒须图、盒式图或箱线图，是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用，常见于品质管理。它主要用于反映原始数据分布的特征，还可以进行多组数据分布特征的比较。

要绘制箱形图，我们需要了解最大值、最小值、中位数、两个四分位数（上四分位数和下四分位数）和异常值的概念。

最大值、最小值：一组数据中最大的数和最小的数。

中位数：按顺序排列的一组数据中居于中间位置的数，即在这组数据中，平均会有一半的数据比他大，有一半的数据比他小。

四分位数：也称四分位点，是指在统计学中把所有数值由小到大排列并分成四等份，处于三个分割点位置的数值。四分位数指的是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分，其中每部分包含25%的数据。很显然，中间的四分位数就是中位数，因此通常所说的四分位数是指处在25%位置上的数值（称为下四分位数）和处在75%位置上的数值（称为上四分位数）。四分位数的计算有(n+1)/4、(n+1)*3/4和(n-1)、(n-1)*3/4两种，我们一般使用前一种那么下四分位数Q1=(n+1)/4，上四分位数Q3=(n+1)*3/4。

异常值：箱形图中的异常值判断以四分位数（Q3、Q1）和四分位距（IQR=Q3-Q1）为基础，异常值被定义为小于下边缘（Q1－1.5IQR）或大于上边缘（Q3+1.5IQR）的值。除了上下边缘，箱形图中还有极上限（Q3+3IQR）和极下限（Q1-3IQR）的概念。小于下边缘或大于上边缘的异常值称为中度异常，小于极下限或大于极上限的异常值称为极度异常。

有了上述的概念，就可以绘制出箱形图了。一个基本的箱形图如下所示，主要包含六个数据节点，将一组数据从大到小排列，分别计算出他的上边缘，上四分位数，中位数，下四分位数和下边缘，以及可能存在的异常值。

在Matplotlib中，箱形图使用box()或boxplot()绘制。我们使用box()方法分别绘制一个简单的箱形图和一个横向的箱形图。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data = pd.DataFrame(np.random.rand(10, 4), columns=list('abcd'))
print(data)
# 2、创建图像
fig, axes = plt.subplots(1, 2, figsize=(8, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
color = dict(boxes='g', whiskers='r', medians='b', caps='k') # 着色 
ax1 = axes[0]
data.plot.box(ylim=[0, 1], grid=True, color=color, ax=ax1)
ax2 = axes[1]
data.plot.box(vert=False, positions=[1, 4, 5, 7], ax=ax2, grid=True, color=color)
# 4、自定义设置
ax1.set_title("箱型图")
ax2.set_title("横向箱型图")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

设置vert参数为False绘制横向的箱形图，positions确定横向的箱形图在竖直方向上的位置，color传一个dict字典，boxes、whiskers、medians、caps分别表示箱形图的箱子、盒须、中位线、边缘线的颜色。运行后效果如下。

下面介绍boxplot()创建箱形图的方法。可传参数较多，这里尝试了几个常用的。sym是异常点的形状，whis是四分位距IQR的值，默认为1.5，可以设置一个值，也可以设置成一个区间，表示强制上下边缘数据。showmeans和meanline设置是否显示均值线及其形状，meanline为True时，均值线为虚线，False时均值线为一个点。showbox、showcaps、showfliers分别表示是否显示箱线、边缘线、异常值，这里需要注意，没有showmedians这个属性。boxprops、whiskerprops、medianprops、flierprops传入一个字典，分别用于设置箱线、盒须线、中位线、异常值的属性。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data = pd.DataFrame(np.random.rand(10, 4), columns=list('abcd'))
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = fig.add_subplot(111)
data.boxplot(sym='^', vert=True, whis=1.5, 
             patch_artist=False, meanline=True, showmeans=True, 
             showbox=True, showcaps=True, showfliers=True, 
             boxprops=dict(linewidth=2), 
             whiskerprops=dict(linewidth=1), 
             medianprops=dict(linewidth=2), 
             flierprops=dict(linewidth=1), 
             notch=False)
# 4、自定义设置
ax1.set_title("箱型图")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行结果如下图所示。

使用boxplot()方法绘制箱形图，着色还有另一种比较灵活的方法：传入参数return_type='dict'返回一个字典类型，然后从字典类型中取出相关的元素进行属性设置。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# 1、准备数据
data = pd.DataFrame(np.random.rand(10, 4), columns=list('abcd'))
# 2、创建图像
fig = plt.figure(figsize=(4, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = fig.add_subplot(111)
f = data.boxplot(ax=ax1, return_type='dict')
for box in f['boxes']:
    box.set(color='g', linewidth=1)
for whisker in f['whiskers']:
    whisker.set(color='r', linewidth=0.5, linestyle='-')
for cap in f['caps']:
    cap.set(color='gray', linewidth=2)
for median in f['medians']:
    median.set(color='b', linewidth=2)
for flier in f['fliers']:
    flier.set(marker='*', color='k', linewidth=0.5)
# 4、自定义设置
ax1.set_title("箱型图")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

除了设置颜色外，我们还设置了线宽和异常值的形状等其他属性。由于我们的数据集是随机数，所以运行后可能没有异常值，可以多运行几遍或者自己构造一个有异常值的数据集。利用这种方法还可以给每个箱型设置不同的属性。运行结果如下。

处理Image

Matplotlib可以利用其image库对图片进行处理，我们加载一张本地图片。首先导入matplotlib的image包，然后使用imread()方法读取图片，再用pyplot的imshow()方法显示图片。

import matplotlib.pyplot as plt
import matplotlib.image as mpimg

pic_path = '/Users/qhzc-imac-02/Downloads/python.jpg'
img = mpimg.imread(pic_path)
plt.imshow(img)

运行后图片就顺利加载了。

利用colorbar()方法可以给图片添加颜色条，默认为纵向颜色条，换成横向只需要将参数orientation设置为horizontal即可。

import matplotlib.pyplot as plt
import matplotlib.image as mpimg

pic_path = '/Users/qhzc-imac-02/Downloads/python.jpg'
img = mpimg.imread(pic_path)
plt.imshow(img)
# 关闭坐标轴
frame = plt.gca()
frame.axes.get_xaxis().set_visible(False)
frame.axes.get_yaxis().set_visible(False)
# 设置颜色条
plt.colorbar()
plt.colorbar(orientation='horizontal')

运行结果如下图所示。

每个图像都有R、G、B三通道，当我们只保留一个通道时，图像就变成了单通道图像，此时再用imshow方法时，Matplotlib会自动显示成一副伪彩色图像。当显示伪彩色图像时，我们可以通过属性设置其他色彩。

# 0、导入包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import matplotlib.image as mpimg
# 1、准备数据
data = pd.DataFrame(np.random.rand(10, 4), columns=list('abcd'))
pic_path = '/Users/qhzc-imac-02/Downloads/python.jpg'
img = mpimg.imread(pic_path)
# 2、创建图像
fig, axes = plt.subplots(1, 2, figsize=(8, 4), facecolor=(0, 1, 0, 1))
# 3、绘图
ax1 = axes[0].imshow(img)
fig.colorbar(ax1, ax=axes[0])
new_img = img[:,:,0]
ax2 = axes[1].imshow(new_img)
ax2.set_cmap('nipy_spectral')
fig.colorbar(ax2, ax=axes[1])
# 4、自定义设置
axes[0].set_title("原图")
axes[1].set_title("修改图")
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

我们创建两个子图分别显示原图和修改后的图，可以看到，修改后的图的色彩发生了变化。

在Python中处理图片的库有很多，Matplotlib结果OpenCV，Pillow等图片处理库可以做很多有意义的事。

由于图片也是一组数据，我们可以通过构造数据来生成一张图片。利用numpy生成一个4*4的二维数组，然后通过imshow()显示生成的图片。

import matplotlib.pyplot as plt
import numpy as np

# 定义图像数据
data = np.linspace(0, 1, 16).reshape(4, 4)
print(data)
# 显示图像数据
plt.imshow(data)
# 添加颜色条
plt.colorbar()
plt.show()

运行结果如下。

3D图

这里的3D图指的是相对于二维图形来讲的三维图形，可以理解为在原先x、y坐标轴的基础上再加一个z轴。Matpoltlib中创建3D图表与创建2D图表类似，首先创建一个新的图像figure，然后向其添加一个类型为axes3d的新轴，使用关键字projection='3d'创建axes3d对象，基本创建方法如下。

import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

上述代码我们创建了一个3D坐标系，因为创建3D图表需要用到axes3d对象，导入的包除了matplotlib的pyplot包之外，还需要从mpl_toolkits的mplot3d包中引入Axes3D，运行结果如下图所示。

3D线状图

3D线状图就是在2D线状图x，y数据组的基础上再加一组数据z。下面我们创建x，y，z三组数据，然后作为对比，分别绘制2D线状图和3D线状图。

# 0、导入包
import matplotlib as mpl
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
import matplotlib.pyplot as plt

# 设置图例字体大小
mpl.rcParams['legend.fontsize'] = 10
# 1、准备数据
theta = np.linspace(-4 * np.pi, 4 * np.pi, 100)
z = np.linspace(-2, 2, 100)
r = z**2 + 1
x = r * np.sin(theta)
y = r * np.cos(theta)
# 2、创建图像
fig = plt.figure(figsize=(10, 4))
# 3、绘图
ax1 = fig.add_subplot(121)
ax1.plot(x, y, label='2D线状图')
ax2 = fig.add_subplot(122, projection='3d')
ax2.plot(x, y, z, label='3D线状图')
# 4、自定义设置
ax1.legend()
ax2.legend()
# 5、保存图形（按需要使用）
# plt.savefig(‘xxx.png’)
# 6、显示图形
plt.show()

运行后结果如下。可以看到，3D线状图相比于2D线状图就像是把2D图像往第三轴拉一样。

3D散点图

3D散点图和2D散点图之间的关系与3D线状图和2D线状图之间的关系类似，只是对散点的坐标增加了第三轴。Matplotlib中3D散点图的绘制与2D散点图一样，仍然使用scatter()方法，只是在原先的基础上增加了参数z和zdir分别表示第三轴数据和第三轴命名，不难想到，2D散点图只是将z置为了0。基本用法如下，我们分别绘制2D散点图和3D散点图。

from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
import numpy as np


def randrange(n, vmin, vmax):
    '''
    创建n个分布在vmin~vmax的数据
    '''
    return (vmax - vmin)*np.random.rand(n) + vmin

fig = plt.figure(figsize=(10, 4))
ax1 = fig.add_subplot(121)
ax2 = fig.add_subplot(122, projection='3d')

n = 100
# 对于每一组样式和范围设置，在框中绘制n个随机点
# defined by x in [23, 32], y in [0, 100], z in [zlow, zhigh].
for c, m, zlow, zhigh in [('r', 'o', -50, -25), ('b', '^', -30, -5)]:
    xs = randrange(n, 23, 32)
    ys = randrange(n, 0, 100)
    zs = randrange(n, zlow, zhigh)
    ax1.scatter(xs, ys, c=c, marker=m)
    ax2.scatter(xs, ys, zs, c=c, marker=m)
ax1.set_xlabel('X')
ax1.set_ylabel('Y')
ax1.set_title('2D散点图')
ax2.set_xlabel('X')
ax2.set_ylabel('Y')
ax2.set_zlabel('Z')
ax2.set_title('3D散点图')

plt.show()

运行结果如下。

线框图

线框图类似于网格图，Matplotlib中绘制线框图使用Axes3D的plot_wireframe()方法，传入参数除了数据组x，y，z之外，还有两组重要参数，分别是rstride、cstride和rcount、ccount。rstride、cstride分别表示行列之间的跨度，rcount、ccount分别表示行列之间的间隔个数，两组参数只能二选一设置，如果同时设置，会抛出ValueError异常错误。rstride、cstride和rcount、ccount设置的时候如果其中一个值设置为0，线框图就会变成3D线图。我们利用axes3d对象的get_test_data()方法创建一组测试数据，然后绘制三个线框图，并将其中两个分别设置行之间跨度为0，列之间跨度为0。

from mpl_toolkits.mplot3d import axes3d
import matplotlib.pyplot as plt

fig = plt.figure(figsize=(12, 3))
ax1 = fig.add_subplot(131, projection='3d')
# 从get_test_data方法中获取一些测试数据
X, Y, Z = axes3d.get_test_data(0.05)
ax1.plot_wireframe(X, Y, Z, rstride=10, cstride=10)
ax2 = fig.add_subplot(132, projection='3d')
ax2.plot_wireframe(X, Y, Z, rstride=10, cstride=0)
ax3 = fig.add_subplot(133, projection='3d')
ax3.plot_wireframe(X, Y, Z, rstride=0, cstride=10)
plt.show()

运行结果如下。可以看到，行列之间的跨度其中有一个设置为0时，就不再是线框图了，会变得像3D线图一样。

曲面图

曲面图可以观察分析不同系列数据之间的关系，在连续曲面上跨两维显示数值的趋势。Matplotlib中曲面图的绘制使用Axes3D的plot_surface()方法，默认情况下，曲面图是以纯色的阴影着色的。plot_surface()方法与上述讲到的绘制线框图plot_wireframe()方法一样，也有rstride、cstride和rcount、ccount两组参数，且二者只能二选一使用，与plot_wireframe()方法不同的是，plot_surface()方法中，rstride、cstride和rcount、ccount两组参数不管选哪一组使用任意一个参数都不能为0，否则会报错。此外，antialiased参数为设置抗锯齿，默认为True。基本用法如下。

from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
from matplotlib import cm
from matplotlib.ticker import LinearLocator, FormatStrFormatter
import numpy as np

fig = plt.figure(figsize=(17, 5))
ax1 = fig.add_subplot(131, projection='3d')
ax2 = fig.add_subplot(132, projection='3d')
ax3 = fig.add_subplot(133, projection='3d')
# 构造数据
x1 = np.arange(-5, 5, 0.25)
y1 = np.arange(-5, 5, 0.25)
x1, y1 = np.meshgrid(x1, y1)
r1 = np.sqrt(x1**2 + y1**2)
z1 = np.sin(r1)

u2 = np.linspace(0, 2 * np.pi, 100)
v2 = np.linspace(0, np.pi, 100)
x2 = 10 * np.outer(np.cos(u2), np.sin(v2))
y2 = 10 * np.outer(np.sin(u2), np.sin(v2))
z2 = 10 * np.outer(np.ones(np.size(u2)), np.cos(v2))

x3 = np.arange(-5, 5, 0.25)
y3 = np.arange(-5, 5, 0.25)
xlen = len(x3)
ylen = len(y3)
x3, y3 = np.meshgrid(x3, y3)
r3 = np.sqrt(x3**2 + y3**2)
z3 = np.sin(r3)
# 设置颜色
colortuple = ('y', 'b')
colors = np.empty(x1.shape, dtype=str)
for y in range(ylen):
    for x in range(xlen):
        colors[x, y] = colortuple[(x + y) % len(colortuple)]
# 绘图 antialiased是否关闭抗锯齿
ax1.plot_surface(x1, y1, z1, cmap=cm.coolwarm, linewidth=0, antialiased=False)
ax2.plot_surface(x2, y2, z2, color='b')
ax3.plot_surface(x3, y3, z3, facecolors=colors, linewidth=0, antialiased=True)
# 自定义Z轴
ax1.set_zlim(-1.01, 1.01)
ax1.zaxis.set_major_locator(LinearLocator(10))
ax1.zaxis.set_major_formatter(FormatStrFormatter('%.02f'))
ax3.set_zlim(-1, 1)
ax3.w_zaxis.set_major_locator(LinearLocator(6))
plt.show()

运行结果如下图所示。我们创建了3个不同形状的曲面图，第一个图和第三个图分别设置antialiased为False和True，显示的纹路清晰度是不一样的（这里为了展示不同的色彩，第一个图和第三个图的纹路对比可能不是很清晰，可以尝试设置第三个图的antialiased分别为False、True进行对比）。

三角形曲面图

三角形曲面图顾名思义就是用一个个小三角形堆起来的曲面图，Matplotlib中使用Axes3D中的plot_trisurf()方法绘制。plot_trisurf()方法的常用参数及意义如下。

x，y，z：作为数据值作为一维数组。

color：表面贴片的颜色。

cmap：表面补丁的颜色图。

norm：规范化的一个实例，用于将值映射到颜色。

vmax，vmin：要映射的最大、最小值。

shade：是否对面色进行投影。

基本用法如下，核心是创建用于构成曲面图的小三角形。我们绘制三个不同形状的三角形曲面图。

from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.tri as mtri

fig = plt.figure(figsize=(17, 5))

n_radii = 8
n_angles = 36
# 创建半径和角度空间
radii = np.linspace(0.125, 1.0, n_radii)
angles = np.linspace(0, 2*np.pi, n_angles, endpoint=False)
# 对每个半径重复所有角度
angles = np.repeat(angles[..., np.newaxis], n_radii, axis=1)
# 将极坐标（半径、角度）转换为笛卡尔坐标（X、Y）。(0，0)是在此阶段手动添加的，因此不会有重复项(x，y)平面上的点。
x = np.append(0, (radii*np.cos(angles)).flatten())
y = np.append(0, (radii*np.sin(angles)).flatten())
# 计算z创建曲面
z = np.sin(-x*y)
ax = fig.add_subplot(131, projection='3d')
ax.plot_trisurf(x, y, z, linewidth=0.2, antialiased=True)

n_angles = 36
n_radii = 8
min_radius = 0.25
radii = np.linspace(min_radius, 0.95, n_radii)
angles = np.linspace(0, 2*np.pi, n_angles, endpoint=False)
angles = np.repeat(angles[..., np.newaxis], n_radii, axis=1)
angles[:, 1::2] += np.pi/n_angles
# 将半径、角度对映射到X、Y、Z点
x = (radii*np.cos(angles)).flatten()
y = (radii*np.sin(angles)).flatten()
z = (np.cos(radii)*np.cos(angles*3.0)).flatten()
# 创建三角测量 没有三角形，因此创建了Delaunay三角测量
triang = mtri.Triangulation(x, y)
# 去掉不需要的三角形
xmid = x[triang.triangles].mean(axis=1)
ymid = y[triang.triangles].mean(axis=1)
mask = np.where(xmid**2 + ymid**2 < min_radius**2, 1, 0)
triang.set_mask(mask)
ax = fig.add_subplot(132, projection='3d')
ax.plot_trisurf(triang, z, cmap=plt.cm.CMRmap)

# 在参数化变量u和v的空间中创建一个网格
u = np.linspace(0, 2.0 * np.pi, endpoint=True, num=50)
v = np.linspace(-0.5, 0.5, endpoint=True, num=10)
u, v = np.meshgrid(u, v)
u, v = u.flatten(), v.flatten()
x = (1 + 0.5 * v * np.cos(u / 2.0)) * np.cos(u)
y = (1 + 0.5 * v * np.cos(u / 2.0)) * np.sin(u)
z = 0.5 * v * np.sin(u / 2.0)
# 三角化参数空间确定三角形
tri = mtri.Triangulation(u, v)
ax = fig.add_subplot(133, projection='3d')
ax.plot_trisurf(x, y, z, triangles=tri.triangles, cmap=plt.cm.Spectral)
ax.set_zlim(-1, 1)

plt.show()

运行结果如下图所示。

3D等高线图

Matplotlib中使用Axes3D的contour()方法绘制等高线图。contour()方法的常用参数及意义如下。

x，y，z：作为数据值作为一维数组。

extend3d：是否在3d中扩展轮廓（默认值：False）。

stride：用于延伸轮廓的步幅（步幅大小）。

zdir：要使用的方向：x、y或z（默认）。

offset：偏移。如果指定了偏移，则在垂直于Zdir的平面上绘制该位置上轮廓线的投影。

基本用法如下。

from mpl_toolkits.mplot3d import axes3d
import matplotlib.pyplot as plt
from matplotlib import cm

fig = plt.figure(figsize=(17, 5))

ax1 = fig.add_subplot(131, projection='3d')
X, Y, Z = axes3d.get_test_data(0.05)
cset = ax1.contour(X, Y, Z, cmap=cm.coolwarm)
ax1.clabel(cset, fontsize=9, inline=1)

ax2 = fig.add_subplot(132, projection='3d')
X, Y, Z = axes3d.get_test_data(0.05)
cset = ax2.contour(X, Y, Z, extend3d=True, cmap=cm.coolwarm)
ax2.clabel(cset, fontsize=9, inline=1)

ax3 = fig.add_subplot(133, projection='3d')
X, Y, Z = axes3d.get_test_data(0.05)
ax3.plot_surface(X, Y, Z, rstride=8, cstride=8, alpha=0.3)
cset = ax3.contour(X, Y, Z, zdir='z', offset=-100, cmap=cm.coolwarm)
cset = ax3.contour(X, Y, Z, zdir='x', offset=-40, cmap=cm.coolwarm)
cset = ax3.contour(X, Y, Z, zdir='y', offset=40, cmap=cm.coolwarm)
ax3.set_xlabel('X')
ax3.set_xlim(-40, 40)
ax3.set_ylabel('Y')
ax3.set_ylim(-40, 40)
ax3.set_zlabel('Z')
ax3.set_zlim(-100, 100)

plt.show()

以上代码创建了三个不同的3D等高线图，运行结果如下图所示。

3D填充等高线图

3D填充等高线图其实就是对3D等高线图进行填充，Matplotlib中使用Axes3D的contourf()方法绘制3D填充等高线。我们针对上述的第一和第三个3D等高线图数据绘制3D填充等高线图。

from mpl_toolkits.mplot3d import axes3d
import matplotlib.pyplot as plt
from matplotlib import cm

fig = plt.figure(figsize=(11, 5))

ax1 = fig.add_subplot(121, projection='3d')
X, Y, Z = axes3d.get_test_data(0.05)
cset = ax1.contourf(X, Y, Z, cmap=cm.coolwarm)
ax1.clabel(cset, fontsize=9, inline=1)

ax2 = fig.add_subplot(122, projection='3d')
X, Y, Z = axes3d.get_test_data(0.05)
ax2.plot_surface(X, Y, Z, rstride=8, cstride=8, alpha=0.3)
cset = ax2.contourf(X, Y, Z, zdir='z', offset=-100, cmap=cm.coolwarm)
cset = ax2.contourf(X, Y, Z, zdir='x', offset=-40, cmap=cm.coolwarm)
cset = ax2.contourf(X, Y, Z, zdir='y', offset=40, cmap=cm.coolwarm)
ax2.set_xlabel('X')
ax2.set_xlim(-40, 40)
ax2.set_ylabel('Y')
ax2.set_ylim(-40, 40)
ax2.set_zlabel('Z')
ax2.set_zlim(-100, 100)

plt.show()

运行结果如下图所示。

多边形图

多边形图顾名思义就是类似多边形的一个图表，Matplotlib中使用Axes3D的add_collection3d()方法绘制多边形图，基本用法如下。我们在三维坐标系下绘制4个多边形，为便于区别，我们使用4种颜色。

from mpl_toolkits.mplot3d import Axes3D
from matplotlib.collections import PolyCollection
import matplotlib.pyplot as plt
from matplotlib import colors as mcolors
import numpy as np

fig = plt.figure(figsize=(6, 5))
ax = fig.gca(projection='3d')


def cc(arg):
    return mcolors.to_rgba(arg, alpha=0.6)

xs = np.arange(0, 10, 0.4)
verts = []
zs = [0.0, 1.0, 2.0, 3.0]
for z in zs:
    ys = np.random.rand(len(xs))
    ys[0], ys[-1] = 0, 0
    verts.append(list(zip(xs, ys)))

poly = PolyCollection(verts, facecolors=[cc('r'), cc('g'), cc('b'),
                                         cc('y')])
poly.set_alpha(0.7)
ax.add_collection3d(poly, zs=zs, zdir='y')

ax.set_xlabel('X')
ax.set_xlim3d(0, 10)
ax.set_ylabel('Y')
ax.set_ylim3d(-1, 4)
ax.set_zlabel('Z')
ax.set_zlim3d(0, 1)

plt.show()

严格来讲，我们绘制的多边形并不是3D图表，只是在3维坐标系下绘制了4个二维多边形。运行结果如下图所示。

3D柱状图

3D柱状图就是在三维坐标系下的柱状图，Matplotlib中使用Axes3D的bar()方法绘制3D柱状图，常用参数及其含义如下。

left：柱状图左侧的X坐标。

height：柱状图的高度。

zs：z坐标，如果指定了一个值，则它们都将放置在同一个z上。

zdir：在绘制二维集时用作z（“x”、“y”或“z”）的方向。

基本用法如下。

from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
import numpy as np

fig = plt.figure(figsize=(6, 5))
ax = fig.add_subplot(111, projection='3d')
for c, z in zip(['r', 'g', 'b', 'y'], [30, 20, 10, 0]):
    xs = np.arange(20)
    ys = np.random.rand(20)

    # You can provide either a single color or an array. To demonstrate this,
    # the first bar of each set will be colored cyan.
    cs = [c] * len(xs)
    cs[0] = 'c'
    ax.bar(xs, ys, zs=z, zdir='y', color=cs, alpha=0.8)

ax.set_xlabel('X')
ax.set_ylabel('Y')
ax.set_zlabel('Z')

plt.show()

与多边形图一样，我们绘制的3D柱状图实际上并不是3D图表，只是在3维坐标系下绘制的柱状图。运行结果如下图所示。

3D箭图

3D箭图就是一个箭头的三维区域，Matplotlib中使用Axes3D的quiver()方法绘制箭图，常用参数及其含义如下。

x，y，z：箭头位置的X、Y和Z坐标（默认为箭头的尾部）。

u，v，w：箭头向量的x、y和z分量。参数可以是数组或标量，也可以是屏蔽数组。如果任何参数中的元素被屏蔽，则不会绘制相应的quiver元素。

length：每个震颤的长度，默认为1.0，单位与轴相同。

arrow_length_ratio：箭头相对于箭袋的比率，默认为0.3。

pivot：位于网格点的箭头部分。箭头围绕该点旋转，因此命名为Pivot。默认为“tail”。

normalize：正则化。如果为True，则所有箭头的长度都相同。默认为False，其中箭头的长度将根据u、v、w值的不同而不同。

基本用法如下，哇满绘制一系列箭头。

from mpl_toolkits.mplot3d import axes3d
import matplotlib.pyplot as plt
import numpy as np

fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot(111, projection='3d')

# Make the grid
x, y, z = np.meshgrid(np.arange(-0.8, 1, 0.2),
                      np.arange(-0.8, 1, 0.2),
                      np.arange(-0.8, 1, 0.8))

# Make the direction data for the arrows
u = np.sin(np.pi * x) * np.cos(np.pi * y) * np.cos(np.pi * z)
v = -np.cos(np.pi * x) * np.sin(np.pi * y) * np.cos(np.pi * z)
w = (np.sqrt(2.0 / 3.0) * np.cos(np.pi * x) * np.cos(np.pi * y) *
     np.sin(np.pi * z))

ax.quiver(x, y, z, u, v, w, length=0.1, normalize=True)

plt.show()

运行结果如下图所示。

3D图中的2D数据

在三维坐标系中，我们可以任取二维展示我们的2D数据。下面我们分别在(x，y)平面下绘制线状图，在(x，z)平面下绘制散点图。

from mpl_toolkits.mplot3d import Axes3D
import numpy as np
import matplotlib.pyplot as plt

fig = plt.figure(figsize=(8, 6))
ax = fig.gca(projection='3d')

# 以x轴、y轴为面绘制线状图
x = np.linspace(0, 1, 100)
y = np.sin(x * 2 * np.pi) / 2 + 0.5
ax.plot(x, y, zs=0, zdir='z', label='(x,y)下的线状图')
# 以x轴、z轴为面绘制散点图
colors = ('r', 'g', 'b', 'k')
x = np.random.sample(20*len(colors))
y = np.random.sample(20*len(colors))
c_list = []
for c in colors:
    c_list.extend([c]*20)
ax.scatter(x, y, zs=0, zdir='y', c=c_list, label='(x,z)下的散点图')

ax.legend()
ax.set_xlim(0, 1)
ax.set_ylim(0, 1)
ax.set_zlim(0, 1)
ax.set_xlabel('X')
ax.set_ylabel('Y')
ax.set_zlabel('Z')

# Customize the view angle so it's easier to see that the scatter points lie
# on the plane y=0
ax.view_init(elev=20., azim=-35)

plt.show()

运行后结果如下图所示。

3D图表添加文本

和2D图表一样，我们也可以在三维坐标系中添加文本，Matplotlib中使用Axes3D的text()方法给3D图表添加文本。text()方法的常用参数和意义如下。

x，y，z：确定文本在三维坐标线中的位置。

s：文本内容。

zdir：设置用作z方向的方向。

此外，还可以使用text2D()方法在三维坐标系所在平面添加文本。下面是绘制文本的基本用法。

from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt

fig = plt.figure(figsize=(8, 6))
ax = fig.gca(projection='3d')

zdirs = (None, 'x', 'y', 'z', (1, 1, 0), (1, 1, 1))
xs = (1, 4, 4, 9, 4, 1)
ys = (2, 5, 8, 10, 1, 2)
zs = (10, 3, 8, 9, 1, 8)

for zdir, x, y, z in zip(zdirs, xs, ys, zs):
    label = '(%d, %d, %d), dir=%s' % (x, y, z, zdir)
    ax.text(x, y, z, label, zdir)

ax.text(9, 0, 0, "red", color='red')

# 前两个参数表示位置 (0, 0)在左下方, (1, 1)在右上方
ax.text2D(0.05, 0.95, "2D Text", transform=ax.transAxes)

ax.set_xlim(0, 10)
ax.set_ylim(0, 10)
ax.set_zlim(0, 10)
ax.set_xlabel('X axis')
ax.set_ylabel('Y axis')
ax.set_zlabel('Z axis')

plt.show()

运行后结果如下图所示。

你可能感兴趣的:(数据分析)

深入解析：Tableau在数据可视化中的高级应用 Echo_Wish 实战高阶大数据信息可视化数据分析数据挖掘
深入解析：Tableau在数据可视化中的高级应用引言在大数据时代，数据可视化已成为数据分析中不可或缺的一部分。作为一款广受欢迎的数据可视化工具，Tableau以其强大的功能和灵活性，赢得了众多数据分析师的青睐。然而，许多人在使用Tableau时，仅停留在基本操作层面，未能充分发挥其潜力。本文将深入探讨Tableau的高级应用，展示其在复杂数据分析中的强大能力，并以具体实例说明其实际应用效果。数据预
Anaconda 配置镜像源猿代码_xiao python pytorch python 深度学习
Anaconda镜像使用帮助Anaconda是一个用于科学计算的Python发行版，支持Linux,Mac,Windows,包含了众多流行的科学计算、数据分析的Python包。Anaconda安装包可以到https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/下载。TUNA还提供了Anaconda仓库与第三方源（conda-forge、msys2
python panda下载_pandas python下载|Pandas for python v0.25.0官方版 v0.25.0官方版 - 哩咯下载站... weixin_39647458 python panda下载
Pandas是python的数据分析包，最初被作为金融数据分析工具而开发出来，提供pandas.whl包下载，有需要的赶快下载吧！软件介绍Pandas是python的一个数据分析包，最初由AQRCapitalManagement于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发team继续开发和维护，属于PyData项目的一部分。Pandas最初被
数据分析利器：COMEX外盘期货主力连续合约与月份合约研究方法银河金融数据库外盘期货高频历史行情数据下载数据分析区块链数据挖掘金融
数据分析利器：COMEX外盘期货主力连续合约与月份合约研究方法为了促进学习和研究，我们在此分享一部分匿名处理的外盘期货高频历史行情数据集。外盘期货分钟高频历史行情数据链接:https://pan.baidu.com/s/19zhe1CCpDM56amDKO2nMwQ?pwd=4wpq提取码:4wpq请注意，分享这些数据的目的是为了教育和研究，不构成任何投资建议。关键词：量化;量化;贵金属;计算能力
阿里云 MaxCompute MaxQA 开启公测，解锁近实时高效查询体验阿里云大数据AI技术阿里云云原生 MaxCompute 大数据实时数仓
随着实时、近实时数据分析需求的持续增长，查询响应时间在现代数据分析和业务应用中变得越来越重要。为减少查询响应时间，提升数据效率，阿里云云原生大数据计算服务MaxCompute推出MaxQA（原MCQA2.0）查询加速功能，在独享的查询加速资源池的基础上，对管控链路、查询优化器、执行引擎、存储引擎以及缓存机制等多个环节进行全面优化，显著减少了查询响应时间，适用于BI场景、交互式分析以及近实时数仓等对
数据分析-56-深入理解假设检验的步骤和T检验的应用案例皮皮冰燃数据分析数据分析假设检验
文章目录1假设检验(HypothesisTesting)1.1假设检验的步骤1.1.1提出假设1.1.2选择显著性水平1.1.3选择检验统计量1.1.4计算检验统计量1.1.5确定临界值或p值1.2假设检验的类型1.2.1单尾检验(One-tailedtest)1.2.2双尾检验(Two-tailedtest)2T检验2.1单样本t检验2.2独立样本t检验2.3配对样本t检验3应用案例3.1单样本
EBS 性能不足？从吞吐量到 IOPS，阿里云全方位优化 Anna_Tong 阿里云云计算存储加速吞吐量优化 RAID配置云计算运维 IOPS 提升
在云计算环境中，存储性能对于业务稳定运行至关重要，尤其是数据库、大数据分析、AI计算等高IO需求的应用。然而，许多用户在使用EBS（弹性块存储）时，可能会遇到磁盘吞吐量或IOPS（每秒输入/输出操作数）不足的问题，导致应用响应变慢、数据处理延迟，甚至影响业务连续性。那么，是什么原因导致EBS性能瓶颈？如何优化吞吐量和IOPS以提升存储性能？阿里云又能提供哪些优化方案？本文将从存储架构、性能监控、优
供应链商业数据分析求职指南：技能点、工具包与业务模式全解析 xl.liu 数据分析数据挖掘
引言随着中国经济的快速发展，国内企业对供应链管理的关注度日益增加。为了应对激烈的市场竞争，企业纷纷寻求通过优化供应链来提高效率、降低成本并增强响应速度。在这个背景下，供应链商业数据分析（SupplyChainBusinessAnalytics）作为连接数据与决策的关键桥梁，逐渐成为企业不可或缺的一部分。对于有志于从事这一领域的专业人士而言，掌握必要的技能、熟悉先进的工具以及理解特定的业务模式是成功
使用Python抓取新闻媒体网站的最新头条与相关内容：深入的爬虫开发与数据分析实战 Python爬虫项目 2025年爬虫实战项目 python 爬虫数据分析数据挖掘人工智能开发语言
引言在互联网时代，新闻媒体网站是人们获取信息和了解世界的重要渠道。随着新闻的即时更新，获取最新头条并进行数据分析成为许多行业领域（如媒体、广告、舆情监测等）的重要需求。通过抓取新闻媒体网站的内容，我们不仅能获取各类新闻文章，还能为后续的数据分析、情感分析、舆情监控等提供基础数据。本篇博客将详细讲解如何使用Python编写一个爬虫，抓取新闻媒体网站的最新头条及其相关内容。我们将使用最新的技术栈，包括
Python爬虫实战：获取笔趣阁图书信息，并做数据分析 ylfhpy 爬虫 python 爬虫数据分析
注意：以下内容仅供技术研究，请遵守目标网站的robots.txt规定，控制请求频率避免对目标服务器造成过大压力！1.环境准备与反爬策略pythonimportrequestsfrombs4importBeautifulSoupimportpandasaspdimportreimporttimeimportrandomfromfake_useragentimportUserAgent#需安装：pip
火山引擎 DataWind ChatBI 适配 DeepSeek-R1 及 DeepSeek-V3 大数据
2025年2月，火山引擎智能数据洞察DataWind旗下AI助手ChatBI宣布实现对DeepSeek-R1及DeepSeek-V3的适配。通过融合豆包、DeepSeek等主流大模型的先进能力，ChatBI正在为企业用户带来精准、智能的数据分析体验。作为Data+AI领域的先行者，DataWind一直致力于帮助业务达到最好的实践成果，DataWind对主流大模型始终保持高效的开放探索态度，融合前沿
生态碳汇涡度相关监测与通量数据分析岁月如歌，青春不败生态遥感数据分析碳汇生态科学涡度通量大涡模拟 MATLAB
1、以涡度通量塔的高频观测数据，基于MATLAB：2、涡度通量观测基本概况：观测技术方法、数据获取与预处理等3、涡度通量数据质量控制：通量数据异常值识别与剔除等4、涡度通量数据缺失插补：结合气象数据进行通量数据缺失插补等5、涡度通量数据组分拆分：计算生态系统呼吸和总初级生产力等6、涡度通量数据可视化分析：绘制不同通量组分数据的时间变化等7、涡度通量与气象数据相关性：时间序列相关分析、回归分析等8、
python数据分析一周速成1.先从查询开始吧噼里啪啦噼酷啪Q 数据分析 python 数据分析 CDA
写在前面众所周知，20%的知识点可以覆盖80%的使用场景。时间就是生命~~咱主打一个“用最小的成本，收获最大化”！有它了不仅不怕excel卡顿，还能实现懒人神器——办公自动化，你喝茶他干活，鼠标自由咯！快跟我来，感受一周速成的效率~~首先，安装python+编辑器（cmd下载和anaconda一个效果嗷）：下载python：来官网DownloadPython|Python.org（建议用3.8~3
如何做数据清洗,有完整的流程么? 魔王阿卡纳兹大数据治理与分析大数据数据清洗数据处理流程去除噪声干净的数据
数据清洗是数据分析和处理过程中不可或缺的一环，其目的是通过识别和纠正数据中的错误、重复、不一致等问题，提高数据的质量和可用性。根据提供的多条证据，数据清洗的完整流程可以总结如下：1.数据预处理数据预处理是数据清洗的第一步，主要包括以下几个方面：数据审查：对数据进行初步检查，识别空值、异常值和噪声数据。数据备份：在进行数据清洗之前，备份原始数据以防止数据丢失。数据筛选：根据清洗目标，对数据进行初步筛
创新市场调查方法，精准把握消费者脉搏（消费者调查） zhonglidc01 消费者调查市场调查咨询大数据人工智能
在当今竞争激烈的市场环境中，（第三方市场调查）企业要想精准把握消费者需求，制定有效的市场策略，（市场咨询公司）创新的市场调查方法至关重要。成都中立调查公司凭借17年的深厚调研经验，（问卷调查）结合线上线下调查、运用大数据分析等创新举措，致力于为客户提供更具前瞻性的市场洞察，助力企业精准把握消费者脉搏，提升市场竞争力。一、结合线上线下调查，全面覆盖消费者群体线上调研：便捷高效，触达广泛受众在互联网时
成都专业市场调查，为企业决策提供有力支持 zhonglidc01 消费者调查大数据
在风云变幻的商业世界中，（市场咨询公司）（第三方市场调查）企业每一次决策都关乎着生死存亡。精准的市场信息是企业决策的基石，而专业的市场调查机构则是获取这些信息的关键桥梁。成都中立调查公司，（市场调研公司）作为一家深耕市场调研领域17年的成都本土企业，凭借严谨的调查方法和科学的数据分析，为众多企业提供准确、可靠的市场信息，助力企业做出明智决策，有效降低市场风险。成都中立调查公司深知，严谨的调查方法是
本地部署Deepseek：从零开始，打造你的私人AI助手！软件求生 #工作建议架构微服务云原生 java 开发语言
大家好，我是小米，一个31岁、热爱技术的“技术宅”。今天我要和大家分享一个超级酷炫的技术——本地部署Deepseek！如果你对AI感兴趣，或者想拥有一个属于自己的私人AI助手，那这篇文章绝对不容错过！Deepseek是什么？在开始之前，我们先来聊聊Deepseek到底是什么。简单来说，Deepseek是一个基于深度学习的AI模型，它可以帮助你完成各种任务，比如自然语言处理、图像识别、数据分析等等。
Boss直聘-AI行业岗位与薪资水平调研姚瑞南 AI行业资讯 AI行业产品调研人工智能自然语言处理 AIGC 经验分享笔记
2022年6月更渠道公司职位名称职位类型薪资水平是否要求PMP证书JDboss直聘字节跳动智能服务运营专家运营25-50K*15薪无智能IM机器人转人工、解决率指标提升boss直聘唯品会AI产品经理PM35-65K*14薪无智能产品规划与设计、数据分析、行业调研、推动项目、协同作业boss直聘京东智能机器人产品运营运营20-40K*15薪无智能客服机器人运营boss直聘字节跳动AI训练技术项目经理
快速入门Web3开发的多个基础知识和如何进行链上开发算了吧吧吧 web3 区块链
最近我开始远程办公，因此有更多的空闲时间，打算开始进行一些区块链上数据分析的工作。然而，由于对web3的了解并不深入，我需要一些帮助来更好地理解相关知识。当然，所谓的“入门”只是一个开始，之后还有很多内容需要学习。对许多人来说，进入web3世界并不难，难的是找到正确的学习方向和路径。在网上可以找到的教程差别比较大，现有的资源零零散散，缺乏系统化的学习路径，有些内容其实现在有更好的解决方案，比如So
Python爬虫+数据分析：京东商品评论数据接口代码逐梦人爬虫技能晋升路线 python 爬虫数据分析
一、引言在电商领域，商品评论数据蕴含着丰富的信息，如消费者的满意度、产品的优缺点等。京东作为国内知名的电商平台，其商品评论数据对于商家进行市场调研、改进产品，以及消费者了解商品真实情况都具有重要价值。通过获取京东商品评论数据接口，我们可以方便、高效地获取这些有价值的信息，为后续的数据分析和决策提供支持。二、接口概述需要说明的是，京东并没有公开免费的商品评论数据接口供开发者随意使用。如果要获取京东商
Python爬虫+数据分析：淘宝商品评论页面数据代码逐梦人爬虫技能晋升路线 python 爬虫数据分析
一、引言在电商平台中，商品评论包含了大量消费者的反馈信息，这些信息对于商家了解产品优缺点、改进服务，以及消费者做出购买决策都具有重要价值。淘宝作为国内知名的电商平台，其商品评论页面的数据蕴含着丰富的信息。通过Python爬虫技术获取这些数据，并运用数据分析方法进行处理和解读，可以挖掘出有价值的商业洞察。然而，需要注意的是，淘宝有严格的反爬机制，在进行爬虫操作时要遵守相关法律法规和平台规则，避免过度
流行编程语言全解析：优势、应用与短板 a小胡哦 python java c++c语言 javascript swift r语言
Python：优势Python以其简洁、易读的语法闻名，新手能快速上手。丰富的库和框架，能极大地提高开发效率。适用领域数据科学与分析：处理和分析大规模数据集，进行数据可视化。典型示例：Google用Python进行数据分析，处理海量数据以支持各种业务决策。机器学习与人工智能：构建和训练模型。典型示例：OpenAI在很多人工智能项目中广泛使用Python，如GPT系列模型的研发。网络爬虫：轻松从网页
APP开发实战130-APP三方服务介绍 xjbclz Android-综合 APP开发实战
32三方服务介绍在开发APP的时候，有许多服务功能可以集成三方SDK实现，以下是一些常用的SDK：数据分析：腾讯MTA、友盟、阿里云消息推送：极光、个推、友盟、小米、华为、阿里云阿里云的推送里集成了小米和华为的推送服务，建议推送选择阿里云，这样不用自己集成小米和华为的推送服务。IM：环信、融云、极光位置服务：高德、百度高德的导航功能比百度好，尤其在一些小地方性能监测：OneAPM、听云、透视宝、博
pymodbus Server和Client示例漫无目的行走的月亮 python 前端服务器
PyModbus是一款功能强大且易于使用的Modbus协议实现库，适用于工业自动化、物联网、能源管理和数据分析等领域。Server：frompymodbus.serverimport(ModbusTcpServer,)frompymodbus.datastoreimport(ModbusSequentialDataBlock,ModbusServerContext,ModbusSlaveConte
python量化交易策略实例_Day 80 量化投资与Python——项目案例 weixin_39964660 python量化交易策略实例
数据分析项目案例股票分析小结：需求：使用tushare包获取某股票的历史行情数据。输出该股票所有收盘比开盘上涨3%以上的日期。输出该股票所有开盘比前日收盘跌幅超过2%的日期。#需求四：假如我从2010年1月1日开始，每月第一个交易日买入1手股票，每年最后一个交易日卖出所有股票，到今天为止，我的收益如何？需求一：使用tushare包获取某股票的历史行情数据。#获取行情df=ts.get_k_data
基于GPT一键完成数据分析全流程的AI Agent: Streamline Analyst Wilson_ZheLIN gpt4 ai agent llms 数据分析
大型语言模型（LLM）的兴起不仅为获取知识和解决问题开辟了新的可能性，而且催生了一些新型智能系统，例如旨在辅助用户完成特定任务的AICopilot以及旨在自动化和自主执行复杂任务的AIAgent，使得编程、创作等任务变得高效而条理。在数据科学和可视化方面，非常多家AICopilot通过提供智能提示、建议或辅助决策等手段有效减小了用户的工作量。但是很少有app针对不同种类数据的预处理、建模、可视化等
DeepSeek 的创新融合：多行业应用实践探索 ♡喜欢做梦人工智能 deepseek
引言在数字化转型的浪潮中，技术的融合与创新成为推动各行业发展的关键力量。蓝耘平台作为行业内备受瞩目的创新平台，以其强大的资源整合能力和灵活的架构，为企业提供了高效的服务支持。而DeepSeek凭借先进的人工智能技术，在自然语言处理、数据分析等领域展现出卓越的性能。当蓝耘平台与DeepSeek携手，二者的优势互补为多行业解决方案带来了全新的应用实践方向，为企业解决复杂业务问题、提升运营效率提供了强大
打造十六进制文本编辑器：从基础到高级功能无形小手
本文还有配套的精品资源，点击获取简介：十六进制文本编辑器是一种用于查看和编辑文件原始二进制数据的工具，它在编程调试和数据分析中尤其有用。这类编辑器提供对CEdit控件的子类化支持，可以处理十六进制字符输入，并自动添加空格以提高可读性。通过子类化CEdit，开发者能够定制标准文本编辑器的行为，实现对输入的限制和自动格式化功能。本项目的实现需要深入了解WindowsAPI、MFC以及二进制数据处理，并
使用OpenAI LLM与Neo4j数据库进行自然语言交互 bBADAS neo4j 数据库交互 python
技术背景介绍在现代数据分析和应用开发中，图数据库以其独特的强大功能越来越受到重视。其中，Neo4j是最受欢迎的图数据库之一。结合自然语言处理（NLP），可以使数据查询变得更加直观和便捷。本篇文章将介绍如何使用OpenAI的语言模型将自然语言问题转换成Cypher查询，并通过Neo4j数据库执行该查询，并给出自然语言的响应。核心原理解析我们的目标是实现一个系统，该系统能够接受自然语言输入，将其转换为
DeepSeek —— 金融市场中的AI颠覆者！！！云边有个稻草人热门文章人工智能金融大数据 DeepSeek
目录云边有个稻草人-CSDN博客引言第1章：DeepSeek的技术概述第2章：DeepSeek对金融行业的影响2.1自动化与决策支持2.2风险评估与管理2.3金融市场预测2.4高频交易与量化分析第3章：展示如何利用DeepSeek进行不同的金融数据分析3.1市场情绪分析3.2新闻事件对股票价格的影响3.3使用DeepSeek进行量化策略回测3.4使用DeepSeek进行投资组合优化第4章：金融界专
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &