Tiny_G

python之Matplotlib

1.数据可视化是什么?

数据可视化是将数据转换为图或表等信息图像,以一种更直观的方式展示和呈现数据.可视化,是通过图形化的手段进行有效地表达,准确高效,简洁全面地传递某种信息,甚至帮助我们发现某种规律和特征,挖掘数据背后的价值.

2. Matplotlib是什么?

matplotlib是一款用于数据可视化的Python软件包,支持跨平台运行,它能够根据Numpy ndarray数组来绘制2D(3D)图像,它使用简单\代码清晰易懂,深受广大技术爱好者喜爱.
优点:

Matplootlib提供了一套面向绘图对象编程的API接口
依托于Python,借助Python的强大的可拓展性,Matplotlib可以在许多不同环境中被使用
基于Matlab和基于面向对象的,完全免费
Matplotlib实现了几乎完全自主控制的图形定义功能
pip 安装：

pip install matplotlib
Anaconda自带

常见Matplotlib全局初始化设置:

# 修改全局字体设置，为支持中文的字体
plt.rcParams['font.sans-serif'] =['SimHei']
# 中文负号
plt.rcParams['axes.unicode_minus']=False
# 修改全局画布对象的分辨率
plt.rcParams['figure.dpi'] =100
# 修改全局画布对象的大小为500X300px
plt.rcParams['figure.figsize']=(5,3)

3. matplotlib的基本方法

方法名	说明
title()	设置图表的名称
xlabel	设置x轴的名称
ylabel	设置y轴的名称
xticks(ticks,label,rotation)	设置x轴的刻度,rotation旋转角度
yticks()	设置y轴的刻度
show()	显示图标
legend()	显示图例
text(x,y,text)	显示每条数据的值

如何将标题或坐标轴写成中文?

默认不支持中文:missing from current font 字体丢失,因此,需要修改字体配置:

plt.rcParams[“font.sans-serif”]

字体说明:

中文字体	说明
‘SimHei’	中文黑体
‘Kaiti’	中文楷体
‘LiSu’	中文隶书
“FangSong”	中文仿宋
‘YouYuan’	中文幼圆
STSong	华文宋体

临时设置成中文字体:

plt.rcParams['font.sans-serif'] = ['SimHei']

当字体设置支撑中文后,必须设置符号,否则当数值中出现负值时,负号无法显示:
解决方式:修改轴中负号编码,不使用unicode的负号,axes表示所有轴(x and y 轴)

plt.rcParams['axes.unicode_minus'] = False

显示中文问题:需要修改2个配置信息:

plt.rcParams['font.sans-serif'] = ['SimHei']#用来设置字体样式以正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False#默认使用Unicode负号,设置成正常显示字符

xlabel和ylabel

对于上面的图,如果觉得字体偏小或者线条太细,可以设置标签文字大小
fontsize参数:设置文字大小
linewidth参数:设置线条
示例代码

plt.rcParams['font.sans-serif'] = ['SimHei']
# 解决方式:修改轴中负号编码axis
plt.rcParams['axes.unicode_minus'] = False
y1 = x
plt.title('y 等于 x的平方')
plt.xlabel('自变量x',fontsize = 16)
plt.ylabel('因变量y')
plt.plot(x,y,linewidth=5)
plt.plot(x,y1)

设置x轴和y轴的刻度

格式:

matplotlib.pyplot.xticks(ticks=None,labels = None,**kwargs)

参数解释:

ticks:此参数是xtick位置的列表.如果将一个空列表作为参数传递,则它将删除所有xticks
label:此参数包含防止字啊给定刻度线位置的标签.
- - kwargs:此参数是文本属性,用于控制标签的外观
  - rotation:旋转角度
  - color:颜色

显示图表 show()

图例legend()

图例是集中于地图一角或一-侧的地图上各种符号和颜色所代表内容与指标的说明，有助于更好的认识地图。
格式：

plt.legend(handles, labels，loc)
eg:ax.legend([line1, line2, line3], [‘label1’, ‘label2’, ‘label3’])

>>更多参数，请在官网查询

显示每条数据的值x,y的值的位置

格式:

plt.text(x,y,string,fontsize = 15,verticalalignment = ‘top’,herizontalalignment = ‘right’)

其他元素可视性

1.显示网格:plt.griid()

格式:

plt.grd(True,linestyle = ‘–’,color = “gray”,linewidth=“0.5”,aixs =“x”)

参数解释:

是否显示网格
linstyle:线型
color:颜色
linewidth:宽度
axis:x,y,both; 显示x/y/两者的网格

2.对坐标轴的操作:plt.gac()

首先观察画布上面的坐标轴,如下图:

上图中，用红色标记出的褐色边界框在Matplotlib中被称为spines,中文翻译为脊柱.
用通俗的话讲,这些边界框线就是坐标轴这个区域的四根"支柱".
因此,我们接下来最终就是要挪动的其实就是这四根"支柱"
且所有操作均在plt.gac()中完成,gca就是get current axes的意思,示列代码:

x = np.arange(-50,51)
y = x**2 + 1
# 获取当前坐标轴
ax = plt.gca()
print(ax)
# 通过坐标轴spines,确定top,bootom,left,right(分别表示上下左右四根支柱)
# 不需要右侧和上侧线条,则可以设置它的颜色为none
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
# 移动左轴到指定位置
# 在这里,position参数有三类型:data,outward(向外),axes

# axes:代表移动整个轴的比例,区间咋0.0 - 1.0之间的值
# ax.spines['left'].set_position(('axes',0.5))

# 'data':表示按数值移动,其后跟的数字代表移动到y轴的刻度,因此也可以这样写:
ax.spines['left'].set_position(('data',0))

# 发现y轴没有跟x轴对齐,可以直接移动x轴的位置
# ax.spines['bottom'].set_position(('data',0))

# 也可以通过设置y轴的z坐标区间来保持对齐
plt.ylim(0,y.max())
plt.plot(x,y)
plt.show()

3. Matplotlib中的样式参数设置

1.线条样式

传入x.y，通过plot画图,并设置折线颜色、透明度、折线样式和折线宽度标记点、标记点大小、标记点边颜色、标记点边宽.网格
格式:

plt.plot(x,y,color =‘red’,alpha=0.3,linestyle=“-”,linewidth=5,marker=‘o’,markeredgecolor=‘r’,marersize= ‘20’,markeredgewidth=10)

1. color:可以使用颜色的16进制,也可以使用线条颜色的英文,还可以英文缩写:

缩写	颜色	全称
‘b’	蓝色	blue
‘g’	绿色	green
‘r’	红色	red
‘c’	青色	cyan
‘m’	品红	magenta
‘y’	黄色	yellow
‘k’	黑色	balack
‘w’	白色	white

1. alopha:透明度,取值0-1
1. linestyle:折线样式

字符	描述
‘-’	实线
‘–’	虚线
‘-.’	点划线
‘:’	虚线

1. marker:标记点样式:

标记符号	描述
‘.’	点标记
‘o’	圆圈
‘x’	"X"标记
‘D’	钻石标记
‘H’	六角标记
‘s’	正方形标记
‘+’	加号

示例代码:

x = np.arange(0,100,10)
y = x ** 2
plt.plot(x,y,linewidth='1',label='test',color = 'r',linestyle='--',marker = 'H')
plt.legend(loc = 'upper left')
plt.show()

4.创建图形对象

在Matplotlib中,面向对象编程的核心思想是创建图形对象(figure object).通过图像对象来调用其他的方法和属性,这样有助于我哦恩更好的采购与苦多个画布.在这个过程中,pyplot负责生成图形对象,并通过该对象来添加一个或多个axes对象(即绘图区域).
Matplotlib 提供了 matplotlib.figure图形类模块,它包含了创建了图像对象的方法.通过调用pyplot模块中的figure()函数来实例化figure对象.

1.创建图形对象

figure方法如下:

plt.figure(
    num=None,#图像编号或名称,数字为编号,字符串为名称
    figsize=None,#指定figure的宽和高,单位为英寸
    dpi=None,#指定绘图对象的分辨率,即没英寸多少个像素,缺省值为72
    facecolor=None,#背景颜色
    edgecolor=None,#边框颜色
    frameon=True,#是否显示边框
    **kwargs,
)

示例代码:

x = np.arange(0,50)
y = x**2
# 创建图形对象
fig = plt.figure('f1',figsize=(6,4),dpi=100,facecolor='gray')
plt.plot(x,y)
plt.show()

5.绘制多子图

figure是绘图对象(可以理解为一个空白的画布),一个figure对象可以包含多个Axes子图,一个Axes是一个绘图区域,不加设置时,Axes=1,且每次绘图都是在figure上的Axes上绘图.
下面将介绍几种绘制子图的方式:

add_axes():添加区域
subplot():均等地划分画布,只是创建一个包含子图区域的画布(返回区域对象 )
subplots():既创建一个包含子图区域的画布又创建一个figure图形对象.(返回图形对象和区域对象)

1.add_axes();添加区域

Matplotlib定义了一个axes类（轴域类)，该类的对象被称为axes对象（即轴域对象)，它指定了一个有数值范围限制的绘图区域。在一个给定的画布(figure)中可以包含多个axes对象，但是同一个axes对象只能在一个画布中使用。

2D绘图区域(axes)包含两个轴(axis)对象

语法格式:
add_axes(rect):

该方法用来生成一个axes 轴域对象，对象的位置由参数rect决定
rect是位置参数，接受一个由4个元素组成的浮点数列表，形如[left,bottom, width, height]，它表示添加到画布中的矩形区域左下角坐标(x,y),以及宽度和高度

注意:每个元素的值是画布宽度和高度的分数。即将画布的宽、高作为1个单位。比如，[ 0.2,0.2,0.5,0.5]，它代表着从画布20%的位置开始绘制,宽高是画布的50%

演示代码:

fig = plt.figure(figsize=(4,2),dpi=200,facecolor='g')
# ax1从画布起始位置绘制,宽度和高度与画布一致
ax1 = fig.add_axes([0,0,1,1])
# 在ax1区域里面作画
x = np.arange(0,11,2)
y = 5*x + 1
ax1.plot(x,y,marker='D')
ax1.legend()
# ax2 从画布的20%位置开始绘制,宽高是画布的60%
ax2 = fig.add_axes([.2,.2,.6,.6])
# 在ax2区域里面作画
y2 = x**2 +3
ax = plt.gca()
ax.spines['top'].set_color('None')
ax.spines['right'].set_color('None')
ax.plot(x,y2)

2.subplot():均匀地划分画布

格式:

ax = plt.subplot(nrows,ncols,index,*args,**kwargs)

参数解释:

nrows:行
ncols:列
index:位置索引
kwargs:title/xlabel/ylabel等

也可以将几个参数的值写到一起,如:subplot(233)

返回:区域对象
nrows 与ncols表示要划分几行几列的子区域(nrows’nclos表示子图数量)，index的初始值为1，用来选定具体的某个子区域.
例如: subplot(233)表示在当前画布的右上角创建一个两行三列的绘图区域（如下图所示)，同时，选择在第3个位置绘制子图。

注意:

plot(y),参数x可以省略,默认从[0,…,N-1],N为y轴的元素个数

实例代码:

ax1 = plt.subplot(211)
ax1.plot(range(50,70),marker='o')
ax1.grid()
ax2 = plt.subplot(212)
ax2.plot(np.arange(12)*2)

注意:

如果新建的子图与现有的子图重叠,那么重叠部分的子图将会被自动删除,因为它们不可以共享绘图区域axes

实例代码:

plt.plot([1,2,3])
# 现在创建一个子图,他表示一行二列的网格顶部
# 因为这个子图将于第一个重叠,所以之前创建的图将被自动删除
plt.subplot(211)
plt.plot(range(50,70))
plt.subplot(212)
plt.plot(np.arange(12)*2)
# Auto-removal of overlapping axes is deprecated since 3.6 and will be removed two minor releases later; explicitly call ax.remove() as needed.

如果不想覆盖之前的图,需要先创建画布:
实例代码:

plt.plot([1,2,3,4])
# 还可以设置画布大小,再通过画布创建区域
fig = plt.figure(num = 'f1',figsize=(6,4),dpi=200)
ax1 = fig.add_subplot(111)
plt.plot(range(20))
ax2 = fig.add_subplot(221)
plt.plot(range(12))

3.设置多图的基本方式:

3.1 在开始创建的时候直接设置

对于subplot关键词赋值参数的查看,可以将光标移动到subplot方法上,使用 shift+tab查看具体内容.
示例代码:

fig = plt.figure('f1',figsize=(20,10),dpi=200,facecolor='r',edgecolor='b',frameon=True)
ax1 =fig.add_subplot(211,title = 'f1.upper',xlabel='x axies',ylabel='y axies')
ax1.plot(range(50,70),linewidth= 2)
ax2 = fig.add_subplot(212,title='f1.lower',xlabel='x axise', ylabel='y axies')
plt.plot(np.arange(12)**2)
#紧凑的布局处理:
plt.tight_layout()

如果发现子图标题发生重叠,在最后调用:

plt.tight_layout()

3.2 在使用pyplot模块中的方法设置后,再绘制

示例代码:

# 第一区域 
plt.subplot(211)
plt.title('ax1')
plt.xlabel('x axies')
plt.ylabel('y axies')
plt.plot(np.arange(12)**2)
# 第二区域
plt.subplot(212)
plt.title('ax2')
plt.plot(range(20,30,2))
plt.tight_layout()

3.3 使用返回的区域对象设置

注意:

区域对象的方法很多都是以set_ 开头

设置区域对象将不存在设置位置

代码示例:

fig = plt.figure()
ax1 = fig.add_subplot(211)
ax2 = fig.add_subplot(212)
# 第一个区域的设置
ax1.set_title('ax1')
ax1.plot(range(20,30))
# 第二个区域设置
ax2.set_title('ax2')
ax2.plot(np.arange(12)**2)
plt.tight_layout()

4.subplots()函数详解

matplotlib.pyplot模块提供了一个subplots()函数，它的使用方法和subplot())函数类似。其不同之处在于，subplots(). 既创建了一个包含子图区域的画布axes，又创建了一个figure图形对象，而subplot()只是创建一个包含子图区域的画布。
subplots()函数格式:

fig,ax = plt.subplots(nrows,ncols)#nrows和ncols指定子图所占的行数\ 列数

函数的返回值是一个元组,包括一个图形对象和所有的axes对象(即axes二维数组).其中axes对象的数量等于nrows * ncols,且每个axes对象均可以通过索引值访问(从0开始).
如下2行2列数据:

fig,axes = plt.subplots(2,2)
x = np.arange(1,5)
# 绘制平方图像
ax1 = axes[0][0]
ax1.set_title('squrare')
ax1.plot(x,x**2)
# 绘制平方根函数
ax2 = axes[0,1]
ax2.set_title('sqrt')
ax2.plot(x,np.sqrt(x))
# 绘制指数函数
ax3 = axes[1,0]
ax2.set_title('exp')
ax3.plot(x,np.exp(x))
# 绘制对数函数
ax4 = axes[1,1]
ax4.set_title('log')
ax4.plot(x,np.log10(x))

复杂的多个子图画法:

fig = plt.figure()
ax1 = fig.add_subplot(321,facecolor='r')
ax2 = fig.add_subplot(322,facecolor='r')
ax3 = fig.add_subplot(323,facecolor='r')
ax4 = fig.add_subplot(324,facecolor='r')
ax5 =fig.add_subplot(313,facecolor='g')

代码：

fig = plt.figure()
fig.add_subplot(121,facecolor='r')
fig.add_subplot(222,facecolor='g')
fig.add_subplot(224,facecolor='g')

5.不同种类的图

5.1柱状图的绘制

柱状图显示的是不同类别之间的比较关系，高度与其代表的值成正比，水平x轴被指定比价的类别，垂直y轴则表示对应的值。

柱状图可以水平绘制，也可以垂直绘制。

格式:

matplotlib.pyplot.bar(x,height,width:float = 0.8, noottom = None,align:str = ‘center’,data = None,**kwargs)

参数解释：

参数	作用
x	表示x轴坐标，类型为float类型，一般为np.arange()生成的固定步长列表
height	表示柱状图的高度，也就是y的值，类型为float，一般为一个列表，包含生成柱状图的所有值
width	表示柱状图的宽度，取值范围在0=1，默认0.8
bottom	柱状图的起始位置，也就是y轴坐标值的起始位置，默认None
align	柱状图的中心位置，可选值为“center”/“lege”,默认值为center
color	柱状图颜色，默认为蓝色;facecolor=’r’,color = [‘r’,‘g’,‘b’]
alpha	透明度，取值范围在0~1，默认值1
label	标签，设置后需要调用plt.lengend
edgecolor	边框颜色,缩写ec
linewidth	边框宽度，浮点数或类数组，默认为None,缩写lw
tick_label	柱子的刻度标签，字符串或字符串列表，默认值为None
linestyle	线条样式,缩写ls

代码实例：

x = range(5)
data = [5,20,15,10,25]
# 设置标题
plt.title('基本柱状图')
plt.rcParams['font.sans-serif'] = ['SimHei']#用来设置字体样式以正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False
plt.grid(ls= '--',alpha=0.5)
# plt.bar(x,data,bottom=[10,5,20,0,10],facecolor=['r','g','b',])
plt.bar(x,data,ec='c',ls='-',lw='2',bottom=[10,5,20,0,10],color=['r','g','b',])

5.2 同一位置多柱状图的绘制

同一x轴绘制多个柱状图，主要通过调整柱状图的宽度和每个柱状图x轴的起始位置

步骤：

本实例需要对x轴进行计算，因此需要将x轴转数值
确定同一x轴中，每个柱状图x轴的起始位置。
需要设置图形的宽度
图形2的起始位置=图形2起始位置+图形的宽度
图形3的起始位置=图形3起始位置+2倍图形的宽度需-要给每个柱状图循环显示文本内容
显示图例

案列:

代码:

country = ['挪威','德国','中国','美国','瑞典']

# 
gold_medal = [16,12,9,8,8]
silver_medal = [8,10,4,10,5]
bronze_medal = [13,5,2,7,5]

# 将x轴转换为数值
x = np.arange(len(country))
# 设置条形宽度
width = 0.2
# 确定各个类型条形图的起始位置
# 金牌起始位置
gold_x = x
#银牌
silver_x = x + width
# 铜牌
bronze_x = x + 2*width
# 金牌图形
plt.bar(gold_x,gold_medal,width=width,color='gold')
# 银牌图形
plt.bar(silver_x,silver_medal,width=width,color='silver')
# 铜牌
plt.bar(bronze_x,bronze_medal,width=width,color='brown')
# 将x轴标签居中
plt.xticks(x+width,labels=country)
# 显示每个条形图高度数值
for i in range(len(country)):
    plt.text(gold_x[i],gold_medal[i],gold_medal[i],va='bottom',ha='center')
    plt.text(silver_x[i],silver_medal[i],silver_medal[i],va='bottom',ha='center')
    plt.text(bronze_x[i],bronze_medal[i],bronze_medal[i],va='bottom',ha='center')

5.3 堆叠柱状图的绘制

所谓堆叠柱状图就是将不同数组别的柱状图堆叠在一起，堆叠后的柱状图高度显示了两者相加的结果值。
案列:

代码演示：

country = ['挪威','德国','中国','美国','瑞典']
# 
gold_medal = [16,12,9,8,8]
silver_medal = [8,10,4,10,5]
bronze_medal = [13,5,2,7,5]
# 设置x轴坐标
x = np.arange(len(country))
#计算不同数值的起始高度
# 铜牌起始位置
bronze_y = [0]*len(country)
# 银牌起始位置
silver_y = bronze_medal
# 金牌起始位置
gold_y = np.array(silver_y) + np.array(silver_medal) 

# 绘图
line1=plt.bar(x,bronze_medal,width=0.6,bottom=bronze_y,align='center',color ='brown')
line2=plt.bar(x,silver_medal,width=0.6,bottom=silver_y,align='center',color ='silver')
line3=plt.bar(x,gold_medal,width=0.6,bottom=gold_y,align='center',color ='gold')
# 设置x轴刻度和label
plt.xticks(x,country)
# 设置图例
plt.legend([line1,line2,line3],['铜牌','银牌','金牌'])

5.4 水平柱状图的绘制

调用Matplotlib.pyplot的barh()函数可以生成水平柱状图
barh()函数的用法与bar()函数的用法基本一样，只是在调用barh()函数时使用y参数传入Y轴数据，使用width参数传入代表条柱宽度的数据。
格式：

plt.barh(y， width，height=0.8,left=None，, align=‘center’， * kwargs)

案列：

代码示例：

   movie = ['新蝙蝠侠','狙击手','奇迹笨小孩']
   day1 = [4053,2548,1543]
   day2 = [7840,4013,2421]
   day3 = [8080,3673,1342]
   x = np.arange(len(movie))
   # day1的起始宽度
   d1w = np.zeros(len(movie),dtype=int)
   # day2的起始宽度
   d2w = np.array(day1)
   # day3的起始宽度
   d3w = np.array(day2)+d2w
   l1 = plt.barh(movie,width=day1,height=0.2,left=d1w)
   l2 = plt.barh(movie,width=day2,height=0.2,left=d2w)
   l3 = plt.barh(movie,width=day3,height=0.2,left=d3w)
   sum_data = np.array(day1)+np.array(day2)+np.array(day3)
   # horizontalignment垂直，左边、中间或右边
   # verticalalignment控制y位置参数，底部、中心或顶部
   for i in range(len(movie)):
       plt.text(sum_data[i],movie[i],sum_data[i],ha='left',va ='center')
   plt.xlim(0,sum_data.max()+2000)

绘制多位置柱状图:

步骤：

由于需要计算高度，所以需要将y轴转换为数值型
需要设置同图形的高度
计算每个图形的起始高度
绘制图形
替换y轴刻度和label

代码示例：

    movie = ['新蝙蝠侠','狙击手','奇迹笨小孩']
    day1 = np.array([4053,2548,1543])
    day2 = np.array([7840,4013,2421])
    day3 = np.array([8080,3673,1342])
    # 将y轴转换为数值型
    num_y = np.arange(len(movie))
    # 设置条形图的高度
    height = 0.2
    # 计算每个图形起始的高度
    dh1 = num_y
    dh2 = num_y+height
    dh3 = num_y+height*2
    # 绘制图形
    l1 = plt.barh(dh1,day1,height=height)
    l2 = plt.barh(dh2,day2,height=height)
    l3 = plt.barh(dh3,day3,height=height)
    # 将y轴刻度和label改变
    plt.yticks(x+height,labels=movie)
    # 图例
    plt.legend([l1,l2,l3],movie)
    for i in range(len(movie)):
        plt.text(day1[i],dh1[i],day1[i],va='center')
        plt.text(day2[i],dh2[i],day2[i],va='center')
        plt.text(day3[i],dh3[i],day3[i],va='center')
    plt.xlim(0,np.array([day1.max(),day2.max(),day3.max()]).max()+2000)

5.5 直方图的绘制plt.hist()

直方图(Histogram)，又称质量分布图，它是一种条形图的一种，由一系列高度不等的纵向线段来表示数据分布的情况。直方图的横轴表示数据类型，纵轴表示分布情况。
首先，我们需要了解柱状图和直方图的区别。直方图用于概率分布，它显示了一组数值序列在给定的数值范围内出现的概率;而柱状图则用于展示各个类别的频数。

直方图和柱状图的区别:

柱状图	直方图
柱状图一般用于描述离散型分类数据的对比	直方图一般用于描述连续型数据的分布关系
每根柱子宽度固定，柱子之间会有间距	每根柱子宽度固定，柱子之间没有间距
横轴变量可以任意排序	横轴变量有—定顺序规则

将统计值的范围分段，即将整个值的范围分成一系列间隔，然后计算每个间隔中有多少值。直方图也可以被归一化以显示°相对频率。然后，它显示了属于几个类别中的每个类别的占比，其高度总和等于1。

格式：

plt.hist(x,bins =None,range=None,density=None,weights =None,cumulative=False,bottom=None,histtype=‘bar’,align=‘mid’,orientation=‘vertical’,rwidth=None,log=Fasle,color=None,label=None,stacked=False,normed =None)

参数解释：

x:作直方图所要用的数据，必须是一维数组;多维数组可以先进行扁平化再作图;必选参数;
bins:直方图的柱数，即要分的组数，默认为10;
weights:与x形状相同的权重数组;将x中的每个元素乘以对应权重值再计数;如果normed或density取值为True，则会对权重进行归一化处理。这个参数可用于绘制已合并的数据的直方图;
density:布尔,可选。如果"True"，返回元组的第一个元素将会将计数标准化以形成一个概率密度，也就是说，直方图下的面积(或积分)总和为1。这是通过将计数除以数字的数量来实现的观察乘以箱子的宽度而不是除以总数数量的观察。如果叠加也是“真实"的，那么柱状图被规范化为1。(替代normed)
bottom:数组，标量值或None;每个柱子底部相对于y=O的位置。如果是标量值，则每个柱子相对于y=O向上/向下的偏移量相同。如果是数组，则根据数组元素取值移动对应的柱子;即直方图上下便宜距离;
histtype: {bar , 'barstacked ', 'step , 'stepfilled}; 'bar’是传统的条形直方图; ‘barstacked’是堆叠的条形直方图; ‘step’是未填充的条形直方图，只有外边框; ‘stepfilled’是有填充的直方图;当hittype取值为’step或’stepfilled’,width设置失效，即不能指定柱子之间的间隔，默认连接在一起;
align: {left , 'mid ', right)}; "left: 柱子的中心位于bins的左边缘;‘mid’: 柱子位于bins左右边缘之间;‘right’: 柱子的中心位于bins的右边缘
color:具体颜色，数组(元素为颜色)或None。
label:字符串(序列)或None;有多个数据集时，用label参数做标注区分;
normed:是否将得到的直方图向量归一化，即显示占比，默认为O，不归一化;不推荐使用，建议改用density参数;
edgecolor:直方图边框颜色;
alpha:透明度;

返回值：

ndarry:数组或数组列表，代表直方图每个bin代表的值
bins:返回各bin的区间起始位置的值和结束值，注意这里的数组比ndarray多一个
patches:返回每个bin里面包含的数据

代码演示：

    x = np.random.randint(120,181,300)
    # 绘制直方图
    num,bins, pathches = plt.hist(x,bins=10,color='r',edgecolor='g')
    print(num)
    print(bins)
    print(pathches)
    for item in pathches:
        print(item)
        print(item.get_x())
        print(item.get_width())
        print(item.get_height())

添加折线图
在直方图中，我们也可以加一个折线图，辅助我们查看数据变化情况：

首先通过pyplot.subplots()创建Axes对象
通过Axes对象调用hist()方法绘制直方图，返回折线图所需要的下x,y数据
然后Axes对象调用plot()绘制折线图

代码示例:

    x = np.random.randint(120,181,300)
    # 绘制直方图
    num,bins, pathches = plt.hist(x,bins=10,color='r',edgecolor='g')
    print(num)
    print(bins)
    print(pathches)
    plt.plot(bins[:10],num,'--',marker='o')

不等距分组
上面讲的直方图都是等距的，有时候我们需要不等距的直方图，这时候只需要确定分组的上下限就可以了

代码演示：

    fig,ax= plt.subplots()
    x = np.random.normal(100,20,100)#均值和方差
    bins = [50,60,70,90,100,110,140,150]
    ax.hist(x,bins,color='b',edgecolor='w')
    ax.set_xticks(bins,labels=bins)

多类型直方图
我们在使用直方图查查看数据的频率时，有时候会查看多种类型数据出现的频率。
这时候，我们需要列表嵌套的形式传入给hist()方法的x参数

代码演示：

    n_bins = 10
    fig,ax = plt.subplots()
    x_multi = [np.random.randn(n) for n in [10000,5000,2000]]
    # 在实际绘图代码中羽单类型差别不大，只是增加一个图例项
    # 要在hist()函数中先指定图例label
    ax.hist(x_multi,n_bins,histtype='bar',label=['A','B','C'])
ax.legend()

堆叠直方图
我们有时候会对吧同样数据范围情况下，对比两组不同对象群体收集的数据差异

注意点：

直方图属性data:以列表的形式传入两组数据
设置直方图stacked:为True，允许数据覆盖

代码演示：

x1 = np.random.randint(180,200,200)
x2 = np.random.randint(180,200,200)
plt.hist([x1,x2],bins=10,stacked=True,edgecolor='w')

5.6 饼状图plt.pie()

饼状图用来显示一个数据系列，具体来说，饼状图显示一个数据系列中各项目的占项目总和的百分比。
Matplotlib.pyplot,提供了一个pie()函数，该函数可以生成数组中数据的饼状图。您可使用x/sum(x)来计算各个扇形区域占饼图总和的百分比。pie()函数的参数说明如下:

格式:

pyplot.pie(x,explode=None，labels=None，colors=None，autopct=None)

参数解释：

x:数组序列，数组元素对应扇形区域的数量大小。
labels:列表字符串序列，为每个扇形区域备注一个标签名字。
colors;为每个扇形区域设置颜色，默认按照颜色周期自动设置。
autopct:格式化字符串"fmt%pct"，使用百分比的格式设置每个扇形区的标签，并将其放置在扇形区内。注意：参数要用两个%包裹
pctdistance:设置百分比标签与圆心的距离;
labeldistance:设置各扇形标签（图例)与圆心的距离;
explode:指定饼图某些部分的突出显示，即呈现爆炸式;
shadow:是否添加饼图的阴影效果

设置饼状图百分比和文本距离中心位置:

pctdistance:设置百分比标签与圆心的距离;
labeldistance:设置各扇形标签（图例)与圆心的距离;

代码演示：

    plt.rcParams['figure.figsize'] = (5,5)
    # 定义饼 的标签
    labels = ['娱乐','育儿','饮食','房贷','交通','其它']
    # 每个标签所占的数量
    x = [200,500,1200,7000,200,900]
    # 饼状图分离
    explode = (0.03,0.05,0.06,0.04,0.08,0.1)
    # 绘制饼图
    plt.pie(x,labels=labels,autopct='%0.2f%%',explode=explode,shadow=True,labeldistance=1.1,pctdistance=1.4)
    # 图例
    plt.legend()

5.7散点图 plt.scatter()

散点图也叫X-Y图，它将所有的数据以点的形式展现在直角坐标系上，以显示变量之间的相互影响程度，点的位置由变量的数值决定。
通过观察散点图上数据点的分布情况，我们可以推断出变量间的相关性。如果变量之间不存在相互关系，那么在散点图上就会表现为随机分布的离散的点，如果存在某种相关性，那么大部分的数据点就会相对密集并以某种趋势呈现。
数据的相关关系主要分为:正相关（两个变量值同时增长)、负相关（一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等，表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。

格式：

mayplot.pyplot.sactter(x,y,s=None,marker=None,cmap=None,norm=None.vmln=None,vmax=None,alpha=None,linewidths=None,edgecolor=None,plotnonfinite=False,data=None,**kwargs)

参数解释：

x, y→散点的坐标
s→散点的面积
c→散点的颜色（默认值为蓝色，"b’，其余颜色同plt.plot())
marker→散点样式(默认值为实心圆，'o，其余样式同plt.plot( ))
alpha→散点透明度（[0,1]之间的数，0表示完全透明，1则表示完全不透明)
linewidths→散点的边缘线宽
edgecolors →散点的边缘颜色
cmap → Colormap，默认None，标量或者是一个colormap 的名字，只有c是一个浮点数数组的时才使用

案列:

代码示例:

    # x 轴数据
    x = np.random.rand(50)#rand()生成一个[0,1)之间的随机浮点数
    # y轴数据
    y = np.random.rand(50)
    # 生成一个正态分布的浮点数数组，用来描述点的大小
    s = (10* np.random.randn(50))**2
    # 颜色也可以使用元组数字序列
    # 颜色随机
    color = np.random.rand(50)
    plt.scatter(x,y,s,c=color)

可以选择不同的颜色条范围–配合cmap参数
颜色条Colormap
Matplotlib模块提供了很多可用的颜色条。
颜色条就像一个颜色列表，其中每种颜色都有一个范围从О到100的值。
下面是一个颜色条的例子:viridis

#####cmap的分类
cmap主要分为以下四大类:、

1.Sequential colormaps:连续化色图
特点:在两种色调之间近似平滑变化，通常是从低饱和度（例如白色）到高饱和度（例如明亮的蓝色)。
应用:适用于大多数科学数据，可直观地看出数据从低到高的变化。

1)以中间值颜色命名(eg: viridis松石绿):[‘viridis’, ‘plasma’, ‘inferno’, ‘magma’; ‘clvidis’]
2)以色系名称命名，由低饱和度到高饱和度过渡(eg: YIOrRd = yellow-orange-red，其它同理): [Greys’, ‘Purples’, ‘Blues’, ‘Greens’, ‘Oranges’,‘Reds’,‘YIOrBr’ , "YIOrRd’, ‘OrRd’, ‘PuRd’,‘RdPu’, ‘BuPu’, ‘GnBu’, ‘PuBu’, ‘YIGnBu’, ‘PuBuGn’, ‘BuGn’, ‘YIGn’, “binary’, ‘gilst_yarg’,‘gist_gray’, ‘gray’, ‘bone’, ‘pink’,‘spring’, ‘summer’, ‘autumn’, 'winter , 'coo”, ‘Wistia’,"hot’, ‘afmhot’glst_heat’, 'copper]

2. Diverging colormaps:两端发散的色图

特点:具有中间值（通常是浅色)，并在高值和低值处平滑变化为两种不同的色调。
应用:适用于数据的中间值很大的情况（例如0，因此正值和负值分别表示为颜色图的不同颜色)。[‘PiYG’, ‘PRGn’, ‘BrBG’, ‘PuOr’, ‘RdGy’, ‘RdBu’, ‘RdYlBu’,‘RdYlGn’, ‘Spectral’, ‘coolwarm’, ‘bwr’, ‘seismic’]

3.Cyclic colormaps:周期图
对于周期图，我们希望以相同的颜色开始和结束，并满足中间对称的中心点。可选参数：
[‘twilight’, ‘twilight_shifted’, ‘hsv’]

4.Qualitative colormaps:离散化色图
特点:离散的颜色组合
应用:在深色背景上绘制一系列线条时，可以在定性色图中选择一组离散的颜色,参数：[‘Pastel1’, ‘Pastel2’, ‘Paired’, ‘Accent’, ‘Dark2’,‘Set1’, ‘Set2’, ‘Set3’, ‘tab10’, ‘tab20’, ‘tab20b’,‘tab20c’]

更多信息请参考，官网

5.8保存图片pyplot.savefig()

格式：

pyplot.savefig(fname,dpi=None,facecolor=‘w’,edgecolor=‘w’,orientation=‘portrait’.papertype=None,format=None,transparent=False,bbox+inches=None,pad_inches=0.1,frameon=None.metadata=None)

参数解释：

fname:(字符串或者仿路径或仿文件)如果格式已经设置，这将决定输出的格式并将文件按fname来保存。如果格式没有设置，在fname有扩展名的情况下推断按此保存，没有扩展名将按照默认格式存储为“png”格式，并将适当的扩展名添加在fname后面。
dpi:分辨率，每英寸的点数
facecolor(颜色或“auto”，默认值是"auto")∶图形表面颜色。如果是"auto”，使用当前图形的表面颜色。
edgecolor(颜色或“auto”，默认值:“auto"):图形边缘颜色。如果是“auto”，使用当前图形的边缘颜色。
format(字符串)︰文件格式，比如“png”“，“pdf”，“svg”等，未设置的行为将被记录在fname中。
transparent:用于将图片背景设置为透明。图形也会是透明，除非通过关键字参数指定了表面颜色和/或边缘

注意；

plt.savefig()一定要写在plt.show()前面，不然保存的是空白图像
第一个路径参数如果报班不存在的文件夹会报错，可以使用os模块先创建文件夹再保存

5.9 词云图 WordCloud

wordcloud是什么?词云图，也叫文字云，是对文本中出现频率较高的“关键词"予以视觉化的展现，词云图过滤掉大量的低频低质的文本信息，使得浏览者只要一眼扫过文本就可领略文本的主旨。
WordCloud是一款python环境下的词云图工具包，同时支持python2和python3，能通过代码的形式把关键词数据转换成直观且有趣的图文模式。

pip安装:

pip install wordcloud

conda安装:

conda install -c conda-forge wordcloud

格式：

wordcloud = WordCloud(font_path,…)

参数解释：

属性	数据类型\|默认值	解析
font_path	string	字体路径windows：C:/Windows/Fonts/Linux: /usr/share/fonts
width	int (default=400)	输出的画布宽度，默认为400像素
height	int (default=200)	输出的画布高度，默认为200像素
prefer_horizontal	float (default=0.90)	词语水平方向排版出现的频率,默认 0.9 所以词语垂直方向排版出现频率为0.1
mask	nd-array or None(default=None)	如果参数为空，则使用二维遮罩绘制词云如果mask非空，设置的宽高值将被忽略遮罩形状被 mask 取代
scale	float (default=1)	按照比例进行放大画布，如设置为1.5，则长和宽都是原来画布的1.5倍
min_font_size	int (default=4)	显示的最小的字体大小
font_step	int (default=1)	字体步长，如果步长大于1，会加快运算但是可能导致结果出现较大的误差
max_words	number (default=200)	要显示的词的最大个数
stopwords	set of strings or None	设置需要屏蔽的词，如果为空，则使用内置的STOPWORDS
background_color	color value default=”black”	背景颜色
max_font_size	int or Nonedefault=None	显示的最大的字体大小
mode	string (default=”RGB”)	当参数为“RGBA”并且background_color不为空时，背景为透明
relative_scaling	float (default=.5)	词频和字体大小的关联性
color_func	callable, default=None	生成新颜色的函数，如果为空，则使用 self.color_func
regexp	string or None (optional)	使用正则表达式分隔输入的文本
collocations	bool, default=True	是否包括两个词的搭配
colormap	string or matplotlib colormapdefault=”viridis”	给每个单词随机分配颜色，若指定color_func，则忽略该方法
random_state	int or None	为每个单词返回一个PIL颜色

案列演示：

代码演示：

    from matplotlib import pyplot as plt
    from wordcloud import WordCloud

    with open('../something.txt',encoding='utf-8') as f:
        txt = f.read()
        # 调用WordCloud生成实例
        wordcloud = WordCloud(font_path='C:/Windows/Fonts/SIMLI.TTF',
        collocations=False,
        background_color='white',
        width=800,
        height=600,
        max_words=10).generate(txt)
        # font_path:字体路径，如果哦数据文件中包含有中文的话，font_path必须指定字体，否则会出现中文乱码
        # collocations：是否包括两个词的搭配，默认为True,为True时会有重复数据。
        # width:幕布的宽度
        # height:幕布的高度
        # max_words：显示词的最大个数
        # generate：读取文本文件

        # 生成图片
        image = wordcloud.to_image()
        # 展示图片
        image.show()
        # 写入文件
        wordcloud.to_file('tag.png')

如上图所示，wordclud默认是以空格作为分词。但很多时候我们的文本数据并不是单词，而是句子，因此我们需要将句子拆分开之后，才传给wordcloud，所以介绍下面一个库

中文使用词云图–需要使用分词模块jieba

“结巴”分词，中文分词组件,其特点:

支持四种分词模式：
- 精确模式，试图将句子最精确地切开，适合文本分析；
- 全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义；
- 搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。
- paddle模式，利用PaddlePaddle深度学习框架，训练序列标注（双向GRU）网络模型实现分词。同时支持词性标注。paddle模式使用需安装paddlepaddle-tiny，pip install paddlepaddle-tiny==1.6.1。目前paddle模式支持jieba v0.40及以上版本。jieba v0.40以下版本，请升级jieba，pip install jieba --upgrade 。PaddlePaddle官网
支持繁体分词
支持自定义词典

更多介绍，请移步官网，

安装:

代码对 Python 2/3 均兼容

全自动安装：easy_install jieba 或者 pip install jieba / pip3 install jieba
半自动安装：先下载 http://pypi.python.org/pypi/jieba/ ，解压后运行 python setup.py install
手动安装：将 jieba 目录放置于当前目录或者 site-packages 目录
通过 import jieba 来引用
如果需要使用paddle模式下的分词和词性标注功能，请先安装paddlepaddle-tiny，pip install paddlepaddle-tiny==1.6.1。

主要功能:

分词

jieba.cut 方法接受四个输入参数: 需要分词的字符串；cut_all 参数用来控制是否采用全模式；HMM 参数用来控制是否使用 HMM 模型；use_paddle 参数用来控制是否使用paddle模式下的分词模式，paddle模式采用延迟加载方式，通过enable_paddle接口安装paddlepaddle-tiny，并且import相关代码；
jieba.cut_for_search 方法接受两个参数：需要分词的字符串；是否使用 HMM 模型。该方法适合用于搜索引擎构建倒排索引的分词，粒度比较细
待分词的字符串可以是 unicode 或 UTF-8 字符串、GBK 字符串。注意：不建议直接输入 GBK 字符串，可能无法预料地错误解码成 UTF-8
jieba.cut 以及 jieba.cut_for_search 返回的结构都是一个可迭代的 generator，可以使用 for 循环来获得分词后得到的每一个词语(unicode)，或者用
jieba.lcut 以及 jieba.lcut_for_search 直接返回 list
jieba.Tokenizer(dictionary=DEFAULT_DICT) 新建自定义分词器，可用于同时使用不同词典。jieba.dt 为默认分词器，所有全局分词相关函数都是该分词器的映射。

代码案列：

# encoding=utf-8
 import jieba

 seg_list = jieba.cut("我来到北京清华大学", cut_all=True)
 print("Full Mode: " + "/ ".join(seg_list))  # 全模式

 seg_list = jieba.cut("我来到北京清华大学", cut_all=False)
 print("Default Mode: " + "/ ".join(seg_list))  # 精确模式

 seg_list = jieba.cut("他来到了网易杭研大厦")  # 默认是精确模式
 print(", ".join(seg_list))

 seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所，后在日本京都大学深造")  # 搜索引擎模式
 print(", ".join(seg_list))
 # Full Mode: 我/ 来到/ 北京/ 清华/ 清华大学/ 华大/ 大学
 # Default Mode: 我/ 来到/ 北京/ 清华大学
 # 他, 来到, 了, 网易, 杭研, 大厦
 # 小明, 硕士, 毕业, 于, 中国, 科学, 学院, 科学院, 中国科学院, 计算, 计算所, ，, 后, 在, 日本, 京都, 大学, 日本京都大学, 深造

因为上面的分词出来有很多非核心词，例如介词’的’，'了’这种，因此需要使用jieba的另一个方法来提取关键词

jieba.analyse的关键词抽取
```
import jieba.analyse
```
- jieba.analyse.extract_tags(sentence, topK=20, withWeight=False, allowPOS=())
  - sentence 为待提取的文本
  - topK 为返回几个 TF/IDF 权重最大的关键词，默认值为 20
  - withWeight 为是否一并返回关键词权重值，默认值为 False
  - allowPOS 仅包括指定词性的词，默认值为空，即不筛选，n-名词，a-形容词，v-动词
- jieba.analyse.TFIDF(idf_path=None) 新建 TFIDF 实例，idf_path 为 IDF 频率文件

因此，词云图的最终版本:

代码：

    from matplotlib import pyplot as plt
    from wordcloud import WordCloud
    import jieba.analyse
    with open('../something.txt',encoding='utf-8') as f:
    txt = f.read()
    # 将文本拆分成单词
    word_list = jieba.analyse.extract_tags(txt,allowPOS='n')#默认精确模式
    # 将列表拼接成字符村
    word_str =' '.join(word_list)
    # 调用WordCloud生成实例
    wordcloud = WordCloud(font_path='C:/Windows/Fonts/SIMLI.TTF',
    collocations=False,
    background_color='white',
    width=800,
    height=600,
    max_words=50).generate(word_str)
    # font_path:字体路径，如果哦数据文件中包含有中文的话，font_path必须指定字体，否则会出现中文乱码
    # collocations：是否包括两个词的搭配，默认为True,为True时会有重复数据。
    # width:幕布的宽度
    # height:幕布的高度
    # max_words：显示词的最大个数
    # generate：读取文本文件
    
    # 生成图片
    image = wordcloud.to_image()
    # 展示图片
    image.show()
    # 写入文件
    wordcloud.to_file('tag1.png')

你可能感兴趣的:(python,python,matplotlib,开发语言)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
用Python实现简单的猜数字游戏程序媛了了 python 游戏 java
猜数字游戏代码：importrandomdefpythonit():a=random.randint(1,100)n=int(input("输入你猜想的数字："))whilen!=a:ifn>a:print("很遗憾，猜大了")n=int(input("请再次输入你猜想的数字："))elifna::如果玩家猜的数字n大于随机数字a，则输出"很遗憾，猜大了"，并提示玩家再次输入。elifn
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那