孙悟充

【python数据可视化笔记】——matplotlib.pyplot()

1 %matplotlib inline
2 matplotlib图例中文乱码以及坐标负号显示
- 2.1 快速解决办法
- 2.2 永久解决办法
  - 2.2.1 找到自己想要的中文字体
  - 2.2.2 把字体复制到matplotlib的字体文件中
  - 2.2.3 重新加载字体
  - 2.2.4 删除matplotlib缓存文件
3 什么是plt、fig和ax
- 3.1 设置画布fig = plt.figure()
- 3.2 设置轴（子图）fig, ax = plt.subplots()
4 matplotlib.pyplot入门
- 4.1 数值
- 4.2 点的属性
- 4.3 线的属性
- 4.4 创建子图
  - 4.4.1 subplot()
  - 4.4.2 subplot2grid()
  - 4.4.3 axes()
- 4.5 插入文字
  - 4.5.1 注释文本
- 4.6 *非线性坐标轴
5 matplotlib.pyplot进阶
- 5.1 条形图/柱状图
- 5.2 直方图
- 5.3 散点图
- 5.4 堆叠图
- 5.5 饼图

%matplotlib inline

这是一个魔法函数（只能在ipython和jupyter环境下使用），使用%matplotlib命令可以将matplotlib的图表直接嵌入到Notebook之中，或者使用指定的界面库显示图表，它有一个参数指定matplotlib图表的显示方式。inline表示将图表嵌入到Notebook中。可以试着运行一段生成图片的命令，如果前面没有这行代码，输出的是一个图片对象，需要重新运行该段程序才能正常显示，如果有这行代码第一次运行程序块就可以显示图片了。在使用jupyter时的用处不大，因为可以轻松地重复执行程序快。

import matplotlib.pyplot as plt

plt.figure()
plt.title("666")
plt.show()

plt.figure()
plt.title("666")
plt.show()

重启jupyter后执行下面代码

%matplotlib inline
import matplotlib.pyplot as plt

plt.figure()
plt.title("666")
plt.show()

matplotlib图例中文乱码以及坐标负号显示

在图片的标签名，标题名或者图例中出现中文时，直接运行会出现乱码，文字显示为框框

import matplotlib.pyplot as plt

plt.figure()
plt.title("哈哈")
plt.show()

快速解决办法

在导入模块后加入下面代码

plt.rcParams['font.sans-serif']=['SimHei']    # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False    # 用来正常显示负号

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

plt.figure()
plt.title("哈哈")
plt.show()

永久解决办法

找到自己想要的中文字体

在系统中查找已有的字体（好处是不需要安装）：在“C:\Windows\Fonts”中选择后缀为“.ttf”的中文字体并复制，这一步我选择了黑体
在 fontpalace 上下载对应版本的后缀为“.ttf”的字体，复制到“C:\Windows\Fonts”中安装

把字体复制到matplotlib的字体文件中

输入下面命令找到matplotlib配置文件

print(matplotlib.matplotlib_fname())

在“c:\program files\python37\lib\site-packages\matplotlib\mpl-data\matplotlibrc”的“font/ttf”文件夹中粘贴刚刚复制的字体，然后修改配置文件matplotlibrc，去掉以下三行代码开头的#

font.family         : sans-serif

font.sans-serif     : SimHei, DejaVu Sans, Bitstream Vera Sans, ...    # 这里注意要把字体名称SimHei放在第一个

axes.unicode_minus  : False    # 修改为False，作用是解决负号的乱码问题

还要注意有的字体名称并不是字体文件的名称，可以查看字体文件的属性（标题）确认一下

重新加载字体

做完以上操作后执行下面命令

from matplotlib.font_manager import _rebuild

_rebuild()

之后重启python，很多时候这样就解决了。

删除matplotlib缓存文件

如果仍然不能正常显示输入以下代码

matplotlib.get_cachedir()

在’C:\Users\sunch\.matplotlib’找到缓存文件夹并删除该文件夹，之后重启python，如果还是不行可以试试重启电脑，我就是重启了才可以，果然没有什么是一次重启解决不了的，如果有那就两次

import matplotlib.pyplot as plt

plt.figure()
plt.title("哈哈")
plt.show()

什么是plt、fig和ax

这是我们看到作图程序中最常见的几个词。plt是matplotlib.pyplot的简称，我们一般都会用它来代替导入的模块；fig一般出现在
fig = plt.figure()这个命令中，是常用来表示当前画布的一个变量，虽然可以用别的但是大家一般都用fig（figure的缩写）；ax一般和fig一起出现在fig, ax = plt.subplots()命令中，或者单独出现在ax = plt.subplot()命令中，表示当前画布的当前子图对象

设置画布fig = plt.figure()

plt.figure(num, figsize, dpi, facecolor, edgecolor, frameon, FigureClass, clear)的参数说明如下

参数名称	参数类型	参数说明
num	integer or string	画布的名称或序号，默认为从1开始的升序序列
figsize	(float, float)	画布尺寸，默认6.4 x 4.8
dpi	integer	分辨率，默认100
facecolor	color spec	背景色，默认白色（‘w’）
edgecolor	color spec	边界色，默认白色（‘w’）
frameon	bool	是否有边界，默认为True
FigureClass	subclass of Figure	使用自定义的画布对象（没什么用的参数）
clear	bool	是否对存在的画布进行清除，默认为False，即自动创建新画布

函数返回一个Figure对象，也就是fig，它有很多内置的属性和方法，比如set()方法，可以设置更多画布参数

我们也可以不设置fig变量，但是声明fig变量可以增强程序的可读性

import matplotlib.pyplot as plt

fig = plt.figure('lalala', figsize = (7, 7), dpi = 100, facecolor = 'y', edgecolor = 'r')
plt.plot([1, 2, 3], [1, 2, 3])
plt.show()

设置轴（子图）fig, ax = plt.subplots()

fig, ax = plt.subplots()等价于fig, ax = plt.subplots(11)，注意这里的轴不是数学意义上的坐标轴，而是指子图的位置。plt.subplot()函数返回一个Figure对象和一个子图对象的列表：fig, axes = plt.subplots(23)即表示一次性在figure上创建成2*3的网格，然后指定子图的位置进行作图，同fig一样也可以省去对变量的声明，并且也可以直接设置类似figure()函数的参数

fig = plt.figure(figsize = (12, 7))
ax = plt.subplot(231)
ax = plt.subplot(232)
ax = plt.subplot(233)
ax = plt.subplot(234)
ax = plt.subplot(235)
ax = plt.subplot(236)

matplotlib.pyplot入门

官网1

官网2

数值

import matplotlib.pyplot as plt

plt.plot([1,2,3,4])
plt.ylabel('some numbers')
plt.show()

如果 $p l o t ()$ 函数只传入一个列表，那么这个列表的值会默认为y轴的值，x轴会自动创建和列表对应的值，从0开始

import matplotlib.pyplot as plt

plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
plt.show()

点的属性

$p l o t ()$ 函数可以指定一个字符串参数来设置传入点的颜色和形状，如默认为" $b -$ "，其中 $b$ 表示蓝色 $-$ 表示折线，也可以指定为其他颜色和形状

import matplotlib.pyplot as plt

plt.plot([1,2,3,4], [1,4,9,16], 'ro')    # 红色圆点
plt.plot([1,2,3,4], [1,2,3,4], 'bx')   # 蓝色x点
plt.plot([1,2,3,4], [1,3,6,9], 'g-')    # 绿色折线

plt.axis([0, 6, 0, 20])    # 设置坐标轴的限制[xmin, xmax, ymin, ymax]
plt.show()

import numpy as np
import matplotlib.pyplot as plt

t = np.arange(0., 5., 0.2)

plt.plot(t, t, 'r--', t, t**2, 'bs', t, t**3, 'g^')    # 可以直接在一个函数中传入多个图像参数
plt.show()

更多关于 $p l o t ()$ 的点的参数设置（如颜色和形状）查阅plot()

线的属性

下面看一下如何控制线的属性

直接传入实参

import matplotlib.pyplot as plt

plt.plot(range(3), range(3), linewidth=7.0)
plt.show()

用Line2D对象的方法

plot()返回一个Line2D对象的列表，如果想要对其中的某个线的属性进行控制，需要进行序列解包

import matplotlib.pyplot as plt

line, = plt.plot(range(3), range(3), '-')
line.set_antialiased(False)    # 关闭抗锯齿
plt.show()

- 使用setp()命令设置多条属性

&emsp;&emsp;可以直接使用setp()查看可以设置的属性

plt.setp(lines)

agg_filter: a filter function, which takes a (m, n, 3) float array and a dpi value, and returns a (m, n, 3) array
alpha: float
animated: bool
antialiased: bool
clip_box: .Bbox
clip_on: bool
clip_path: [(~matplotlib.path.Path, .Transform) | .Patch | None]
color: color
contains: callable
dash_capstyle: {‘butt’, ‘round’, ‘projecting’}
dash_joinstyle: {‘miter’, ‘round’, ‘bevel’}
dashes: sequence of floats (on/off ink in points) or (None, None)
drawstyle: {‘default’, ‘steps’, ‘steps-pre’, ‘steps-mid’, ‘steps-post’}
figure: .Figure
fillstyle: {‘full’, ‘left’, ‘right’, ‘bottom’, ‘top’, ‘none’}
gid: str
in_layout: bool
label: object
linestyle: {’-’, ‘–’, ‘-.’, ‘:’, ‘’, (offset, on-off-seq), …}
linewidth: float
marker: unknown
markeredgecolor: color
markeredgewidth: float
markerfacecolor: color
markerfacecoloralt: color
markersize: float
markevery: unknown
path_effects: .AbstractPathEffect
picker: float or callable[[Artist, Event], Tuple[bool, dict]]
pickradius: float
rasterized: bool or None
sketch_params: (scale: float, length: float, randomness: float)
snap: bool or None
solid_capstyle: {‘butt’, ‘round’, ‘projecting’}
solid_joinstyle: {‘miter’, ‘round’, ‘bevel’}
transform: matplotlib.transforms.Transform
url: str
visible: bool
xdata: 1D array
ydata: 1D array
zorder: float

关于线的更多属性查阅matplotlib.lines.Line2D

创建子图

每次画图时都会默认创建一个画布（figure(1)）和子图位置（subplot(111)），为了创建子图，我们需要创建一个画布并给出每个子图的位置。

使用gcf()和gca()可以查看当前画布和子图位置

import matplotlib.pyplot as plt

print(plt.gcf())    # get current figure

print(plt.gca())    # get current axes

Figure(432x288)
AxesSubplot(0.125,0.125;0.775x0.755)

subplot()

使用subplot()指定下一个子图的位置，标准写法为plt.subplot(nrows=r, ncols=c, index=i)，当子图数量小于10时，可以简写为plt.subplot(rci)

import numpy as np
import matplotlib.pyplot as plt

def f(t):
    return np.exp(-t) * np.cos(2*np.pi*t)

t1 = np.arange(0.0, 5.0, 0.1)
t2 = np.arange(0.0, 5.0, 0.02)

plt.figure(1)    # 这个命令是可以省略的，因为会默认创建一个画布，1代表画布的序号
#print(plt.gcf())
plt.subplot(211)    # 指定为2行1列画布的第一个位置
#print(plt.gca())
plt.plot(t1, f(t1), 'bo', t2, f(t2), 'k')


plt.subplot(212)    # 指定为2行1列画布的第二个位置
#print(plt.gca())
plt.plot(t2, np.cos(2*np.pi*t2), 'r--')
plt.show()

Figure(432x288)
AxesSubplot(0.125,0.536818;0.775x0.343182)
AxesSubplot(0.125,0.125;0.775x0.343182)

import matplotlib.pyplot as plt

# 第一块画布
plt.figure(1)                
plt.subplot(211)             
plt.plot([1, 2, 3])
plt.subplot(212)             
plt.plot([4, 5, 6])

# 第二块画布
plt.figure(2)                
plt.plot([4, 5, 6])          

# 修改第一块画布
plt.figure(1)    # 指定画布序号
plt.subplot(211)    # 指定子图位置
plt.title('Easy as 1, 2, 3')    # 修改图片内容
plt.show()

"""Examples illustrating the use of plt.subplots().

This function creates a figure and a grid of subplots with a single call, while
providing reasonable control over how the individual plots are created.  For
very refined tuning of subplot creation, you can still use add_subplot()
directly on a new figure.
"""

import matplotlib.pyplot as plt
import numpy as np

# Simple data to display in various forms
x = np.linspace(0, 2 * np.pi, 400)
y = np.sin(x ** 2)

plt.close('all')

# Just a figure and one subplot
f, ax = plt.subplots()
ax.plot(x, y)
ax.set_title('Simple plot')

# Two subplots, the axes array is 1-d
f, axarr = plt.subplots(2, sharex=True)
axarr[0].plot(x, y)
axarr[0].set_title('Sharing X axis')
axarr[1].scatter(x, y)

# Two subplots, unpack the axes array immediately
f, (ax1, ax2) = plt.subplots(1, 2, sharey=True)
ax1.plot(x, y)
ax1.set_title('Sharing Y axis')
ax2.scatter(x, y)

# Three subplots sharing both x/y axes
f, (ax1, ax2, ax3) = plt.subplots(3, sharex=True, sharey=True)
ax1.plot(x, y)
ax1.set_title('Sharing both axes')
ax2.scatter(x, y)
ax3.scatter(x, 2 * y ** 2 - 1, color='r')
# Fine-tune figure; make subplots close to each other and hide x ticks for
# all but bottom plot.
f.subplots_adjust(hspace=0)
plt.setp([a.get_xticklabels() for a in f.axes[:-1]], visible=False)

# row and column sharing
f, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, sharex='col', sharey='row')
ax1.plot(x, y)
ax1.set_title('Sharing x per column, y per row')
ax2.scatter(x, y)
ax3.scatter(x, 2 * y ** 2 - 1, color='r')
ax4.plot(x, 2 * y ** 2 - 1, color='r')

# Four axes, returned as a 2-d array
f, axarr = plt.subplots(2, 2)
axarr[0, 0].plot(x, y)
axarr[0, 0].set_title('Axis [0,0]')
axarr[0, 1].scatter(x, y)
axarr[0, 1].set_title('Axis [0,1]')
axarr[1, 0].plot(x, y ** 2)
axarr[1, 0].set_title('Axis [1,0]')
axarr[1, 1].scatter(x, y ** 2)
axarr[1, 1].set_title('Axis [1,1]')
# Fine-tune figure; hide x ticks for top plots and y ticks for right plots
plt.setp([a.get_xticklabels() for a in axarr[0, :]], visible=False)
plt.setp([a.get_yticklabels() for a in axarr[:, 1]], visible=False)

# Four polar axes
f, axarr = plt.subplots(2, 2, subplot_kw=dict(projection='polar'))
axarr[0, 0].plot(x, y)
axarr[0, 0].set_title('Axis [0,0]')
axarr[0, 1].scatter(x, y)
axarr[0, 1].set_title('Axis [0,1]')
axarr[1, 0].plot(x, y ** 2)
axarr[1, 0].set_title('Axis [1,0]')
axarr[1, 1].scatter(x, y ** 2)
axarr[1, 1].set_title('Axis [1,1]')
# Fine-tune figure; make subplots farther from each other.
f.subplots_adjust(hspace=0.3)

plt.show()

可以用命令clf()和cla()清除当前图片和轴，作用是清理内存。如果不是编写包含非常多图片的程序，该命令可以省略。

subplot2grid()

相比subplot()可以实现跨区域的子图，其参数如下：

参数名称	参数类型	参数说明
shape	sequence of 2 ints	子图的区域形状，如(x, y)表示x行y列的子区域
loc	sequence of 2 ints	子图开始的区域
rowspan	int	子图跨越的行数
colspan	int	子图跨越的列数
fig	Figure, optional	子图所在的画布，默认为当前画布

import matplotlib.pyplot as plt


def annotate_axes(fig):
    for i, ax in enumerate(fig.axes):
        ax.text(0.5, 0.5, "ax%d" % (i+1), va="center", ha="center")
        ax.tick_params(labelbottom=False, labelleft=False)


fig = plt.figure(dpi = 100)
ax1 = plt.subplot2grid((3, 3), (0, 0), colspan=3)
ax2 = plt.subplot2grid((3, 3), (1, 0), colspan=2)
ax3 = plt.subplot2grid((3, 3), (1, 2), rowspan=2)
ax4 = plt.subplot2grid((3, 3), (2, 0))
ax5 = plt.subplot2grid((3, 3), (2, 1))

annotate_axes(fig)

plt.show()

axes()

axes([left, bottom, width, height]) 可以指定子图的具体位置，其中每个参数都应该是[0, 1]上的数字。和subplot()不同的是，axes()是在主图上叠加其他的子图，主图可以有自己的内容，而subplot()是子图的并列，没有主图。

import matplotlib.pyplot as plt
import numpy as np

# create some data to use for the plot
dt = 0.001
t = np.arange(0.0, 10.0, dt)
r = np.exp(-t[:1000]/0.05)               # impulse response
x = np.random.randn(len(t))
s = np.convolve(x, r)[:len(x)]*dt  # colored noise

# the main axes is subplot(111) by default
plt.plot(t, s)
plt.axis([0, 1, 1.1*np.amin(s), 2*np.amax(s)])    # 指定坐标系的范围，相当于plt.xlim(0, 1); plt.ylim(1.1*np.amin(s), 2*np.amax(s))
plt.xlabel('time (s)')
plt.ylabel('current (nA)')
plt.title('Gaussian colored noise')

# this is an inset axes over the main axes
a = plt.axes([.65, .6, .2, .2], facecolor='y')
n, bins, patches = plt.hist(s, 400, density=1)
plt.title('Probability')
plt.xticks([])
plt.yticks([])

# this is another inset axes over the main axes
a = plt.axes([0.2, 0.6, .2, .2], facecolor='y')
plt.plot(t[:len(r)], r)
plt.title('Impulse response')
plt.xlim(0, 0.2)
plt.xticks([])
plt.yticks([])

plt.show()

插入文字

import numpy as np
import matplotlib.pyplot as plt

np.random.seed(20190522)

mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)

# the histogram of the data
n, bins, patches = plt.hist(x, 50, density=1, facecolor='g', alpha=0.75)


plt.xlabel('Smarts')    # 横坐标标签
plt.ylabel('Probability', fontsize=14, color='red')    # 纵坐标标签并指定文字属性
plt.title('Histogram of IQ')    # 标题
plt.text(60, .025, r'$\mu=100,\ \sigma=15$')    # 指定位置插入文字，若无坐标则表示在当前范围内的比值，如(0.5, 0.5, 'xx')表示在中央插入xx
plt.axis([40, 160, 0, 0.03])
plt.grid(True)
plt.show()

更多文字的属性查阅Text properties and layout

更多Tex数学表达式的写法查阅Writing mathematical expressions

import matplotlib.pyplot as plt

x = [1,2,3]
y = [5,7,4]

x2 = [1,2,3]
y2 = [10,14,12]

plt.plot(x, y, label='First Line')    # 声明图例内容
plt.plot(x2, y2, label='Second Line')
plt.title('Interesting Graph\nCheck it out')
plt.legend()    # 插入图例
plt.show()

更多图例的设置查阅legend()

注释文本

使用annotate()可以实现一些更加高级的注释功能

import numpy as np
import matplotlib.pyplot as plt

ax = plt.subplot(111)

t = np.arange(0.0, 5.0, 0.01)
s = np.cos(2*np.pi*t)
line, = plt.plot(t, s, lw=2)

plt.annotate('local max', xy=(2, 1), xytext=(3, 1.5),
            arrowprops=dict(facecolor='black', shrink=0.05),
            )    # xy表示被注释点的位置，xytext表示注释文本的位置

plt.ylim(-2,2)
plt.show()

更多高级功能请查阅annotate()

*非线性坐标轴

就是把y轴映射到另一种表达式如log(y)等，目的是使数据能展示的更全面。更多内容查阅creating scales and transformations

import numpy as np
import matplotlib.pyplot as plt

from matplotlib.ticker import NullFormatter  # useful for `logit` scale

# Fixing random state for reproducibility
np.random.seed(20190522)

# make up some data in the interval [0, 1]
y = np.random.normal(loc=0.5, scale=0.4, size=1000)
y = y[(y > 0) & (y < 1)]
y.sort()
x = np.arange(len(y))

# plot with various axes scales
plt.figure(1)

# linear
plt.subplot(221)
plt.plot(x, y)
plt.yscale('linear')
plt.title('linear')
plt.grid(True)


# log
plt.subplot(222)
plt.plot(x, y)
plt.yscale('log')    # 对数坐标轴
plt.title('log')
plt.grid(True)


# symmetric log
plt.subplot(223)
plt.plot(x, y - y.mean())
plt.yscale('symlog', linthreshy=0.01)
plt.title('symlog')
plt.grid(True)

# logit
plt.subplot(224)
plt.plot(x, y)
plt.yscale('logit')
plt.title('logit')
plt.grid(True)
# Format the minor tick labels of the y-axis into empty strings with
# `NullFormatter`, to avoid cumbering the axis with too many labels.
plt.gca().yaxis.set_minor_formatter(NullFormatter())
# Adjust the subplot layout, because the logit one may take more space
# than usual, due to y-tick labels like "1 - 10^{-3}"
plt.subplots_adjust(top=0.92, bottom=0.08, left=0.10, right=0.95, hspace=0.25,
                    wspace=0.35)

plt.show()

matplotlib.pyplot进阶

条形图/柱状图

条形图是对分类变量进行描述的图形，函数为matplotlib.pyplot.bar()，主要参数如下，更多参数查阅matplotlib.pyplot.bar。或者
matplotlib.pyplot.barh()函数绘制横向的条形图，参数和bar()相同

参数名称	参数类型	参数说明
x	sequence of scalars	条形的坐标序列，长度为条形的个数
height	scalar or sequence of scalars	条形的高度序列，也就是每个条形对应的值序列
width	scalar or array-like	条形的宽度，默认0.8
bottom	scalar or array-like	每个条形关于纵坐标的起始点，默认为0或者None
align	{‘center’, ‘edge’}	条形与x轴的对齐位置，center表示条形中心对齐x轴坐标，edge为左边缘对齐x轴坐标，若要设置右对齐，需要设置为edge并且width同时为负。默认为center
color	scalar or array-like	条形颜色
edgecolor	scalar or array-like	条形边界颜色
linewidth	scalar or array-like	条形边界的宽度，若为0则不画边界
tick_label	string or array-like	条形的标签，默认为None
xerr, yerr	scalar or array-like of shape(N,) or shape(2,N)	误差线，在条形顶部添加水平或垂直的某长度的误差线，水平的误差线很少使用，两者都默认为None，即不添加误差线。误差线也有一些自己的设置如颜色长度等
orientation	{‘vertical’, ‘horizontal’}	条形图垂直或者水平，默认垂直

import matplotlib.pyplot as plt

fig = plt.figure(figsize = (7, 7))

x = [1,2,3,4,5]
h = [20, 14, 38, 27, 9]
w = [0.1, 0.2, 0.3, 0.4, 0.5]
b = [1,2,3,4,5]
c = ['b','g','r','c','m']
ye = [1, 2, 3, 4, 5]

plt.bar(x, h, w, b, color = c, yerr = ye)
plt.show()

import numpy as np
import matplotlib.pyplot as plt

fig = plt.figure(figsize = (7, 7))

N = 5
menMeans = (20, 35, 30, 35, 27)
womenMeans = (25, 32, 34, 20, 25)
menStd = (2, 3, 4, 1, 2)
womenStd = (3, 5, 2, 3, 3)
ind = np.arange(N)    # the x locations for the groups
width = 0.35       # the width of the bars: can also be len(x) sequence

p1 = plt.bar(ind, menMeans, width, yerr=menStd)
p2 = plt.bar(ind, womenMeans, width,
             bottom=menMeans, yerr=womenStd)    # 设置bottom实现堆叠条形图

plt.ylabel('Scores')
plt.title('Scores by group and gender')
plt.xticks(ind, ('G1', 'G2', 'G3', 'G4', 'G5'))
plt.yticks(np.arange(0, 81, 10))
plt.legend((p1[0], p2[0]), ('Men', 'Women'))    # 这里可以直接用(p1, p2)

plt.show()

更多例子查阅bar

直方图

直方图是对连续变量进行统计的图表，函数为matplotlib.pyplot.hist()，主要参数如下，更多参数查阅matplotlib.pyplot.bar。或者使用hist2d

参数名称	参数类型	参数说明
x	(n,) array or sequence of (n,) arrays	数据，可以是一个数组或者多个不定长数组
bins	int or sequence or str	如果传入一个数字，那么表示直方的数量为bins + 1；如果传入一个列表[x1, x2, x3,…,xn]，那么表示人为设置的断点，直方区间为[x1, x2), [x2, x3),…,[xn-1, xn]；如果传入一些字符串如’auto’,'fd’等，更多查阅numpy.histogram_bin_edges
range	tuple or None	限制展示在图表上的数据界限，若不指定默认为(x.min(), x.max())，若bins为1个序列那么range无效
density	bool	若为1调整为频率分布直方图
weights	(n, ) array_like or None	数据的权值（很少用到）
cumulative	bool	直方累加，比如第二个直方显示前两个bin的总和，第三个直方显示前三个bin的总和，以此类推
bottom	array_like, scalar	规定直方关于纵轴的起始点，可以为1个数字或者与bins等长的数组
histtype	{‘bar’, ‘barstacked’, ‘step’, ‘stepfilled’}	直方图类型，默认为bar
align	{‘left’, ‘mid’, ‘right’}	直方中心与每个bin对应的位置，默认mid
orientation	{‘horizontal’, ‘vertical’}	直方图方向，默认垂直。或者使用barh()函数的直方图类型
rwidth	scalar or None	直方相对于bin的宽度，调整使得直方是否连续
color	color or array_like of colors or None	直方颜色，注意不是每个直方的颜色，而是每一个x对应一个颜色
stacked	bool	是否进行堆叠
label	str or None	数据标签，为了展示图里使用

import numpy as np
import matplotlib.pyplot as plt

# Fixing random state for reproducibility
np.random.seed(20190523)

mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)

# the histogram of the data
plt.hist(x, 50, density=True, facecolor='g', alpha=0.75)


plt.xlabel('Smarts')
plt.ylabel('Probability')
plt.title('Histogram of IQ')
plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
plt.axis([40, 160, 0, 0.03])
plt.grid(True)
plt.show()

import numpy as np
import matplotlib.pyplot as plt

np.random.seed(20190523)

dt = np.random.randint(1, 101, 100)
#bins = np.arange(0, 101, 10)
bins = 20
xrange = (20, 80)

fig = plt.figure(figsize = (7, 7))
plt.hist(x = dt, bins = bins, range = xrange, cumulative = True, rwidth = 0.5, color = 'g')
plt.show()

import numpy as np
import matplotlib.pyplot as plt

np.random.seed(20190523)

dt = np.random.randint(1, 101, (100, 2))
bins = np.arange(0, 101, 10)
#bins = 20
#xrange = (20, 80)

fig = plt.figure(figsize = (7, 7))
plt.hist(x = dt, bins = bins, rwidth = 0.5, stacked = True, color = ['b', 'r'], label = ['man', 'woman'])
plt.legend()
plt.show()

散点图

前面已经用过plot()函数画散点图，现在有一个更专业的函数可以画散点图，就是matplotlib.pyplot.scatter()，主要参数如下，更多可以查阅matplotlib.pyplot.scatter

参数名称	参数类型	参数说明
x, y	array_like, shape (n, )	数据
s	scalar or array_like, shape (n, )	点的大小
c	color, sequence, or sequence of color	点的颜色，可以是一个颜色，可以是长度n的颜色序列，可以是n长的使用cmap和norm映射到颜色的数字序列，或者是用RGB或RGBA表示行的2维数组
marker	MarkerStyle	点的形状，更多参阅markers
cmap	Colormap	颜色映射，仅当c为数字序列时有效
norm	Normalize	规范化，仅当c为数字序列时有效
vmin, vmax	scalar	配合norm使用
alpha	scalar	透明度，在0~1之间
linewidths	scalar or array_like	点的边界宽度
edgecolors	{‘face’, ‘none’, None} or color or sequence of color	点的边界颜色，默认为face，即背景色

import numpy as np
import matplotlib.pyplot as plt

# Fixing random state for reproducibility
np.random.seed(20190523)


x = np.random.rand(10)
y = np.random.rand(10)
z = np.sqrt(x**2 + y**2)

fig = plt.figure(figsize = (8, 12))
plt.subplot(321)
plt.scatter(x, y, s=80, c=z, marker=">")

plt.subplot(322)
plt.scatter(x, y, s=80, c=z, marker=(5, 0))

verts = np.array([[-1, -1], [1, -1], [1, 1], [-1, -1]])
plt.subplot(323)
plt.scatter(x, y, s=80, c=z, marker=verts)

plt.subplot(324)
plt.scatter(x, y, s=80, c=z, marker=(5, 1))

plt.subplot(325)
plt.scatter(x, y, s=80, c=z, marker='+')

plt.subplot(326)
plt.scatter(x, y, s=80, c=z, marker=(5, 2))

plt.show()

import numpy as np
import matplotlib.pyplot as plt

# Fixing random state for reproducibility
np.random.seed(20190523)


N = 50
x = np.random.rand(N)
y = np.random.rand(N)
colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2  # 0 to 15 point radii

plt.figure(figsize = (7, 7))
plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

更多例子查阅scatter

堆叠图

堆叠图一般用来显示各部分随时间变化的比重的变化，函数为matplotlib.pyplot.stackplot。部分参数说明如下

参数名称	参数类型	参数说明
x	1d array of dimension N	时间序列
y	2d array (dimension MxN), or sequence of 1d arrays (each dimension 1xN)	每个时间序列下的占比，如(x, y)或(x, y1, y2, y3)，其中y为MxN的数组，yi为N维数组
baseline	{‘zero’, ‘sym’, ‘wiggle’, ‘weighted_wiggle’}	计算堆叠的方式，zero为基本堆叠，sym为零对称方式，更多参阅stackplot
labels	Length N sequence of strings	每个部分的标签
colors	Length N sequence of colors	每个部分的颜色

import matplotlib.pyplot as plt

time = ['19/01', '19/02', '19/03', '19/04', '19/05']

eat = [0.6, 0.5, 0.7, 0.9, 0.8]
game = [0.2, 0.2, 0.1, 0.0, 0.1]
shopping = [0.1, 0.2, 0.1, 0.1, 0.1]
travel = [0.1, 0.1, 0.1, 0.0, 0.0]

plt.figure(figsize = (10, 7))
plt.stackplot(time, [eat, game, shopping, travel], labels = ['吃', '游戏', '购物', '旅游'])    # 这里不把yi放到[]里也是可以的
plt.legend()
plt.title('消费占比')
plt.show()

饼图

函数为matplotlib.pyplot.pie()，更多内容查阅pie。部分参数如下

参数名称	参数类型	参数说明
x	array-like	每部分扇形比例
explode	array-like, optional, default: None	每个扇形偏移的百分比
labels	list, optional, default: None	每个扇形的标签，显示在扇形外
colors	array-like, optional, default: None	每个扇形的颜色
autopct	None (default), string, or function, optional	若非默认会用数字来标记扇形（显示在扇形上），若为格式化字符串会显示为百分比，若为函数会被调用
pctdistance	float, optional, default: 0.6	当auopct有效时表示数字标签与饼图中心的距离
shadow	bool, optional, default: False	显示饼图阴影
labeldistance	float or None, optional, default: 1.1	标签的径向距离，若为None不显示标签但可以用legend()展示
startangle	float, optional, default: None	开始画扇形的角度，默认从x轴即0度开始
radius	float, optional, default: None	饼图半径，默认为1
counterclock	bool, optional, default: True	画图方向，默认逆时针
wedgeprops	dict, optional, default: None	扇形属性，如边缘颜色粗细等，如wedgeprops = {‘linewidth’: 3}
textprops	dict, optional, default: None	文字属性
center	list of float, optional, default: (0, 0)	中心位置
frame	bool, optional, default: False	是否显示边框
rotatelabels	bool, optional, default: False	若为True，将标签旋转到每个切片的角度

import matplotlib.pyplot as plt

# Pie chart, where the slices will be ordered and plotted counter-clockwise:
labels = 'Frogs', 'Hogs', 'Dogs', 'Logs'
sizes = [15, 30, 45, 10]    # 比例
explode = (0, 0.1, 0, 0)  # 偏移

fig1, ax1 = plt.subplots(figsize = (7, 7), dpi = 100)
ax1.pie(sizes, explode=explode, labels=labels, autopct='%1.1f%%',
        shadow=True, startangle=90)    # 从90度开始画图，标签
ax1.axis('equal')  # Equal aspect ratio ensures that pie is drawn as a circle.

plt.show()

import matplotlib.pyplot as plt

labels = 'Frogs', 'Hogs', 'Dogs', 'Logs'
fracs = [15, 30, 45, 10]


fig, axs = plt.subplots(2, 2, figsize = (7, 7), dpi = 200)

# 标准饼图
axs[0, 0].pie(fracs, labels=labels, autopct='%1.1f%%', shadow=True)

# 设置偏移
axs[0, 1].pie(fracs, labels=labels, autopct='%.0f%%', shadow=True, explode=(0, 0.1, 0, 0))

# 调整文字属性和扇形半径，这里声明变量是为了对扇形进行更多的设置
patches, texts, autotexts = axs[1, 0].pie(fracs, labels=labels, autopct='%.0f%%', 
                                          textprops={'size': 'smaller'}, shadow=True, radius=0.5)
# 进一步设置文字属性，注意这里是对上一个而不是下一个扇形的设置
plt.setp(autotexts, size='x-small')
autotexts[0].set_color('white')

# 去掉阴影
patches, texts, autotexts = axs[1, 1].pie(fracs, labels=labels,
                                          autopct='%.0f%%',
                                          textprops={'size': 'smaller'},
                                          shadow=False, radius=0.5,
                                          explode=(0, 0.05, 0, 0))
plt.setp(autotexts, size='x-small')
autotexts[0].set_color('white')

plt.show()

更多例子查阅pie

未完待续

你可能感兴趣的:(python,数据可视化)

Tornado 初识 Wu_Candy Web服务器
一、什么是tornadoTornado是使用Python编写的一个强大的、可扩展的Web服务器。它在处理严峻的网络流量时表现得足够强健，但却在创建和编写时有着足够的轻量级，并能够被用在大量的应用和工具中。二、tornado有什么优势Tornado和现在的主流baiduWeb服务器框架（包括大多数Python的框架）有着明显的区别：它是非阻塞式服务器，而且速度相当快，得利于其非阻塞的方式和对epol
python高并发访问mysql_Python访问MySQL 阿廖林诺
Python访问数据库作为Python开发工程师，选择哪个数据库呢？当然是MySQL。因为MySQL不仅免费，普及率最高，出了错，可以很容易找到解决方法。而且，围绕MySQL有一大堆监控和运维的工具，安装和使用很方便。使用MySQLMySQL是Web世界中使用最广泛的数据库服务器。SQLite的特点是轻量级、可嵌入，但不能承受高并发访问，适合桌面和移动应用。而MySQL是为服务器端设计的数据库，能
Python 爬取大量数据如何并发抓取与性能优化 chusheng1840 Python 教程 python 性能优化开发语言
Python并发抓取与性能优化在进行网络爬虫开发时，爬取大量数据可能非常耗时。尤其是在处理许多网页或API请求时，逐个请求速度会非常慢。为了解决这个问题，我们可以通过并发抓取提高爬取效率。同时，通过性能优化来进一步减少耗时和资源占用，使爬虫更高效。本篇文章将带大家了解Python中常用的并发抓取方法，并介绍如何进行性能优化。1.并发抓取的基本概念并发抓取指的是同时发出多个请求的技术，而不是顺序地等
【机器学习】基于t-SNE数据可视化工程无水先生 AI原理和python实现人工智能综合人工智能算法
一、说明t-SNE(t-DistributedStochasticNeighborEmbedding)是一种常用的非线性降维技术。它可以将高维数据映射到一个低维空间（通常是2D或3D）来便于可视化。Scikit-learnAPI提供TSNE类，以使用T-SNE方法可视化数据。在本教程中，我们将简要学习如何在Python中使用TSNE拟合和可视化数据。二、t-SNE是个什么？2.1什么是t-SNE？
数据处理和分析之数据降维：t-SNE：使用t-SNE进行数据可视化实践 kkchenkx 数据挖掘信息可视化算法聚类均值算法数据挖掘机器学习
数据处理和分析之数据降维：t-SNE：使用t-SNE进行数据可视化实践数据降维简介降维技术的重要性在数据科学和机器学习领域，数据降维是一种关键的技术，用于减少数据集的维度，同时保留数据的结构和重要信息。降维不仅可以帮助我们更有效地存储和处理数据，还能在高维数据中发现潜在的模式和结构，这对于数据可视化和模型训练尤为重要。高维数据往往难以直观理解，通过降维，我们可以将其转换为二维或三维空间，便于可视化
Conda报错解决：ProxyError: Conda cannot proceed due to an error in your proxy configuration. 三采 Linux Conda 代理
目录原因一：源配置有误原因二：代理配置有误原因三：路由配置有误在需要使用代理的服务器下，创建新conda环境时报错：condacreate-nopencompasspython=3.8/usr/lib/python3/dist-packages/requests/__init__.py:89:RequestsDependencyWarning:urllib3(1.26.9)orchardet(3.
基于asp.NET的病历管理系统 (源码+net+vue+部署文档+讲解等) qq_1406299528 计算机毕业设计 asp asp.net vue.js 后端
收藏关注不迷路！！文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录前言程序资料获取一、项目技术二、项目内容和功能介绍三、核心代码数据库参考四、效果图五、资料获取前言博主介绍：✨全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师，专注于Java/Python/小程序app/深度学
爬取电影标题、评论、评分（21-11-4）穆桥 Python爬虫 XPath解析 MySQL数据库电影信息疾病数据
功能描述：1、爬取网页1中的电影名称、评分、简介到mysql数据库中。2、爬取网页2中的标题、时间、正文、采集时间到mysql数据库中。使用的技术:requests请求、xpath解析、mysqlxpath解析语法//子孙节点/直接子节点.选取当前节点…选取当前节点的父节点@选取属性通过Python的lxml库，利用XPath进行HTML的解析。scrapy封装了lxml也可以导入scrapy任务
Python 爬虫实战：电影评论数据抓取与自然语言处理西攻城狮北 python 爬虫开发语言
引言作为一名对电影数据和自然语言处理感兴趣的内容创作者，我决定利用Python爬虫技术抓取IMDb上的电影评论数据，并进行自然语言处理分析。这不仅可以帮助我们了解观众对电影的反馈，还能为电影制作方提供有价值的参考。一、项目背景IMDb（互联网电影数据库）是全球最大的电影数据库，用户可以在上面查看电影信息和用户评论。本项目旨在爬取IMDb上的电影评论，并对评论进行自然语言处理（NLP），以提取情感、
linux（ubuntu）中Conda、CUDA安装Xinference报错ERROR: Failed to build (llama-cpp-python) 小胡说技书杂谈/设计模式/报错 Data/Python/大模型 linux ubuntu conda 大模型 python Xinference
文章目录一、常规办法二、继续三、继续四、缺少libgomp库（最终解决）在Conda环境中安装libgomp如果符合标题情况执行的：pipinstall"xinference[all]"大概率是最终解决的情况。一、常规办法llama-cpp-python依赖CMake、Make和g++来编译，所以可能是缺少依赖或者环境配置不对。按照以下步骤排查问题并解决：1.确保Python版本符合要求llama
基于Asp.net的汽车租赁管理系统计算机学姐 Asp精选实战项目源码 asp.net 汽车后端 mysql sqlserver vue.js c#
作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：Java精选实战项目源码、Python精选实战项目源码、大数据精选实战项目源码系统展示【2025最新】基于Asp.net的汽车租赁管理系统开发
使用yolo训练自己的模型数据遇到的问题次次皮 YOLO 深度学习人工智能
1、报错：NolabelsfoundinD:\xxx\valid\labels.cache查找网上的文章大多都是说文件目录没按规定创建，但我检查了我的目录没问题，后来发现是labels文件夹里的txt文件和images文件夹的图片没有一一对应，对应好之后问题解决2、解决完上个问题之后还是不报上面的错了但还是FatalPythonerror:Aborted；Restartingkernel...检查
Python——文件读取一颗小松松 python 开发语言
Python可以读取不同格式的文件，下面简单来介绍一下：1、使用read_excel或read_csv读取文件，若在路径前加r，使用“\”importpandasaspd#在路径前加r,使用“\”df=pd.read_excel(r'C:\Users\merit\Desktop\测试.xlsx')#导入.csv文件，以“，”为分隔符data=pd.read_csv(r'C:\Users\merit
给接口自动化测试框架增色，实现企业微信测试报告编程简单学软件测试 python python 单元测试压力测试 postman 功能测试
作者在新项目中搭建了python+requests+unittest+HTMLTestRunner接口自动化测试框架，通过修改配置文件实现环境隔离，一份脚本即可在不同的环境执行接口测试用例。但是没有实现任何形式的消息通知，也没有集成到jenkins，原因很简单，因为还没做到很大，而且用户活跃不够，问题也相对较少，只在上线前后执行一次uat和prod环境。那这几天想完善一下消息通知功能，让它具备发送
轻松管理CSV数据，Python csv库全解析嘎啦AGI实验室 Python python android 数据库 Python csv
文章目录轻松管理CSV数据，Pythoncsv库全解析背景介绍csv库是什么？如何安装csv库？五个简单的库函数使用方法1.读取CSV文件2.写入CSV文件3.使用DictReader读取CSV4.使用DictWriter写入CSV5.指定分隔符五个场景使用代码说明场景1：读取CSV并统计数据场景2：将查询结果写入CSV场景3：读取CSV并过滤数据场景4：读取CSV并排序数据场景5：读取CSV并合
#PyCharm 2024.1新增功能 Dingdangr pycharm ide python
PyCharm2024.1作为JetBrains专为Python开发者设计的集成开发环境（IDE）的最新版本，带来了众多令人兴奋的新增功能，旨在提升开发者的编程效率和体验。以下是对这些新增功能的详细解析：一、智能编码辅助HuggingFace模型和数据集文档预览PyCharm2024.1引入了HuggingFace模型和数据集的快速文档预览功能。开发者可以直接在PyCharm内部快速获取Huggi
2025年Python生态全景：从AI霸主到量子计算，揭秘其不可替代的技术魅力南玖yy python 人工智能量子计算
在2025年的技术浪潮中，Python凭借其极简的语法、庞大的生态系统以及跨领域融合能力，依然稳坐编程语言界的“头把交椅”。尽管Java等语言在AI领域发起挑战，但Python通过持续的技术革新和生态扩展，展现出不可撼动的生命力。本文将从技术趋势、行业应用与未来挑战三个维度，解析Python的“常青”密码。一、AI领域的持续主导：生态优势与工具革新Python在AI领域的统治地位仍未动摇。尽管有观
使用Python爬取豆瓣用户信息：从入门到实战 Python爬虫项目 2025年爬虫实战项目 python 开发语言人工智能爬虫大数据
引言豆瓣作为一个知名的社交平台，拥有丰富的用户信息。对于数据分析师、研究人员或普通用户来说，获取豆瓣用户信息具有重要的价值。本文将详细介绍如何使用Python及其相关库来爬取豆瓣用户信息，并展示如何利用最新的技术手段来实现这一目标。1.准备工作在开始编写爬虫之前，我们需要准备一些工具和环境：Python3.x：确保你已经安装了Python3.x版本。Requests库：用于发送HTTP请求。Bea
深入 Python 网络爬虫开发：从入门到实战南玖yy python python爬虫
一、为什么需要爬虫？在数据驱动的时代，网络爬虫是获取公开数据的重要工具。它可以帮助我们：监控电商价格变化抓取学术文献构建数据分析样本自动化信息收集二、基础环境搭建1.核心库安装pipinstallrequestsbeautifulsoup4lxmlseleniumscrapy2.开发工具推荐PyCharm（专业版）VSCode+Python扩展JupyterNotebook（适合调试）三、爬虫开发
python中三元运算符使用总结上趣工作室 python python 开发语言
在Python中，三元运算符通常被称为条件表达式，它的语法为：value_if_trueifconditionelsevalue_if_false这个条件表达式的含义是：如果condition为True，则返回value_if_true，否则返回value_if_false。示例以下是一些使用三元运算符的示例：1、基本使用:x=10result="Greaterthan5"ifx>5else"5o
python中将字符串转换成数字，并且保留两位小数上趣工作室 python python 后端
在Python中，你可以使用float()函数将字符串转换为数字，并使用字符串格式化来保留小数点后两位。下面是一个示例代码：defconvert_to_float(string):try:number=float(string)formatted_number="{:.2f}".format(number)returnformatted_numberexceptValueError:return"
使用 Python 编写网络爬虫：从入门到实战 Manaaaaaaa python 爬虫开发语言
网络爬虫是一种自动化获取网页信息的程序，通常用于数据采集、信息监控等领域。Python是一种广泛应用于网络爬虫开发的编程语言，具有丰富的库和框架来简化爬虫的编写和执行过程。本文将介绍如何使用Python编写网络爬虫，包括基本原理、常用库和实战案例。一、原理介绍网络爬虫是一种自动化程序，通过模拟浏览器的行为向网络服务器发送HTTP请求，获取网页内容并进一步提取所需信息的过程。网络爬虫主要用于数据采集
列表推导式_Python教程曹操贪慕小乔 python基础 python numpy 算法
内容摘要Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、文章正文Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、集合推导式和字典推导式。我们先着重来介绍最常使用的列
【数字IC验证】博客内容全览 MoorePlus 数字IC验证百宝箱经验分享面试数字IC 芯片验证 SV
【导读】：数字IC验证百宝箱涵盖博主在实际工作中常用的技能与工具，包括但不限于SV、UVM、Formal、脚本(perl/python/shell)及EDA工具快速上手使用等。无论你是刚踏入职场的验证小白，还是希望回顾基础寻找跳槽机会的从业者，本专栏都能为你提供实用的技术支持，在达成目标的路上，助你一臂之力。“凡是能用钱买来的时间就是便宜的；凡是能用时间换来的注意力持续就是有价值的。”（附上超链接
[LeetCode]46.全排列（python） xyhaaab leetcode python 算法
1.代码fromtypingimportListclassSolution:defpermute(self,nums:List[int])->List[List[int]]:result:List[List[int]]=[]length=len(nums)deffill(n:int,nums:List[int]):ifn==length:result.append(nums[:])returnfo
rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用原野AI 大模型部署 pdf ocr 深度学习 open-webui
背景rapidocr-onnxruntime是一个跨平台的OCR库，基于ONNXRuntime推理框架。目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。缘起：百度paddle工程化不是太好，为了方便大家在各种端上进行ocr推理，我们将它转换为onnx格式，使用Python/C++/Java/Swift/C#将它移植到各个平台。名称来源：轻快好省并智能。基于深度学
关于scipy中uniform_filter函数的注意事项明·煜 scipy
关于scipy中uniform_filter函数的注意事项在处理分组聚合问题时，有时需要使用均值作为统计量。那其实就是一个均值滤波问题。我不希望使用for循环和均值卷积核来对二维数组进行滤波，因为这个线性运算且可用通过数字搬移来实现。在使用uniform_filter时在边界处会出现难以解释的值，不过后来发现是我对python语法不够熟悉导致的。例如以下代码：importnumpyasnpx=np
c++调用python代码，使用gpu AI改变视界 c++python 开发语言
c++调用python，使用gpu加速1、首先要配置cuda和cudnn的环境1、cmd窗口下nvidia-smi，查看电脑可以支持的最高cuda版本。如果nvidia-smi报错，那么需要去配置一下环境，网上有类似案例。或者通过NVIDIA控制面板/系统信息/组件里查看cuda_xxxx.dll，上面有版本号。2、保证安装的cuda版本要小于电脑支持的版本号。我电脑最大支持cuda11，但是安装
数组中最长递增子序列问题的深入研究 cloudman08 算法
目录摘要一、引言二、问题定义三、问题分析3.1暴力枚举法的困境3.2动态规划的应用3.3二分查找优化四、算法设计4.1动态规划算法4.2二分查找优化算法4.3代码实现（Python）4.4代码解释五、复杂度分析5.1动态规划算法复杂度5.2二分查找优化算法复杂度六、实际应用6.1数据分析6.2生物信息学6.3信号处理七、结论摘要在数组处理的算法领域，寻找最长递增子序列是一个经典且具有广泛应用的问题
Python 爬虫实战：国际航班数据抓取与全球航班网络分析西攻城狮北 python 爬虫开发语言
一、引言随着全球化的加速，国际航班网络已成为现代交通体系的重要组成部分。通过分析国际航班数据，我们可以深入了解全球航空枢纽、热门航线以及航班流量的变化趋势。本文将介绍如何通过爬取国际航班数据，分析全球航班网络的情况，并给出实现爬虫和数据分析的详细过程及代码。二、项目背景与目标2.1项目背景航空交通是全球经济和旅游业的核心部分，了解全球航班网络有助于掌握各大航空公司之间的竞争格局、全球机场的枢纽作用
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一