Dsz095

matplotlib&Seaborn超全实用文档

【导入md文档时格式不对，需要的可以下载juypter源文件拉通跑一次，太长了，推荐配合table of contents开启目录查看（文中配图太多了，手动随便加了几个，大多可以导入包和数据后自己跑下，调格式实在。。黑线脸）】
下载链接：https://download.csdn.net/download/qq_38611819/11240375

1.导入matplotlib&seaborn包

使用'%matplotlib inline':直接在笔记本中渲染图形(应该使用带有命令的内联后端)，可以省略掉plt.show()这一步。

在Retina显示屏等高分辨率屏幕上，jupyter notebook电脑中的默认图像看起来很模糊。在%matplotlib inline后使用%config InlineBackend.figure_format = 'retina'来渲染更高分辨率的图像。

%matplotlib inline    
%config InlineBackend.figure_format = 'retina'
import matplotlib.pyplot as plt
import matplotlib
import seaborn as sns

import numpy as np 
import pandas as pd

Seaborn其实是在matplotlib的基础上进行了更高级的API封装，从而使得作图更加容易，在大多数情况下使用seaborn就能做出很具有吸引力的图，而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充，而不是替代物。

2.matplotlib（pyplot）

2.1 一般概念

Matplotlib 是 Python 的绘图库。它可与 NumPy 一起使用，提供了一种有效的 MatLab 开源替代方案。它也可以和图形工具包一起使用，如 PyQt 和 wxPython。

matplotlib中的所有内容都按层次结构进行组织。 在层次结构的顶部是matplotlib“状态机环境”，它由matplotlib.pyplot模块提供。在此级别，简单函数用于将绘图元素（线条，图像，文本等）添加到当前图形中的当前轴。

层次结构中的下一级是面向对象的接口的第一级，其中pyplot仅用于少数函数，例如图形创建，并且用户显式创建并跟踪图形和轴对象。在此级别，用户使用pyplot来创建图形，并且通过这些图形，可以创建一个或多个轴对象。然后，这些轴对象用于大多数绘图操作。

对于更多的控制 - 这对于在GUI应用程序中嵌入matplotlib图这一点至关重要 - 可以完全删除pyplot级别，留下纯粹的面向对象的方法。

2.2 图形部分

2.2 图形中文显示

Matplotlib 默认情况不支持中文，我们可以使用以下简单的方法来解决：

首先下载字体（注意系统）：https://www.fontpalace.com/font-details/SimHei/

SimHei.ttf 文件放在当前执行的代码文件中：

import matplotlib as mpl
# fname 为 你下载的字体库路径，注意 SimHei.ttf 字体的路径
font1 = mpl.font_manager.FontProperties(fname="D:\py_files\SimHei.ttf") 

x = np.arange(1,11) 
y =  2  * x +  5 
plt.title("标题 - 测试", fontproperties=font1) 

# fontproperties 设置中文显示，fontsize 设置字体大小
plt.xlabel("x 轴", fontproperties=font1)
plt.ylabel("y 轴", fontproperties=font1)
plt.plot(x,y)

[]

此外，我们还可以使用系统的字体：

#打印出你的 font_manager 的 ttflist 中所有注册的名字
sorted([f.name for f in matplotlib.font_manager.fontManager.ttflist])

['Agency FB',
 'Agency FB',

 'STIXSizeOneSym',
 'STIXSizeOneSym',
 'STIXSizeThreeSym',
 'cmtt10']

找一个看中文字体例如：SimHei(黑体）,然后添加以下代码即可：

plt.rcParams['font.family']=['SimHei']

x = np.arange(1,11) 
y =  2  * x +  5 
plt.title("标题 - 测试", fontproperties=font1,fontsize=18) 

# fontproperties 设置中文显示，fontsize 设置字体大小
plt.xlabel("x 轴", fontproperties=font1,fontsize=15)
plt.ylabel("y 轴", fontproperties=font1)
plt.plot(x,y)

[]

2.3 添加格式字符串显示离散值

作为线性图的替代，可以通过向 plot() 函数添加格式字符串来显示离散值。可以使用以下格式化字符。

字符	描述
‘-’	实线样式
‘–’	短横线样式
‘-.’	点划线样式
‘:’	虚线样式
‘.’	点标记
‘,’	像素标记
‘o’	圆标记
‘v’	倒三角标记
‘^’	正三角标记
‘<’	左三角标记
‘>’	右三角标记
‘1’	下箭头标记
‘2’	上箭头标记
‘3’	左箭头标记
‘4’	右箭头标记
‘s’	正方形标记
‘p’
‘*’	星形标记
‘h’	六边形标记 1
‘H’	六边形标记 2
‘+’	加号标记
‘x’	X 标记
‘D’	菱形标记
‘d’	窄菱形标记
‘\|’	竖直线标记
‘_’	水平线标记

以下是颜色的缩写：

字符	颜色
‘b’	蓝色
‘g’	绿色
‘r’	红色
‘c’	青色
‘m’	品红色
‘y’	黄色
‘k’	黑色
‘w’	白色

要显示圆来代表点，而不是上面示例中的线，请使用 ob 作为 plot() 函数中的格式字符串。

x = np.arange(1,11) 
y =  2  * x +  5 
plt.title("Matplotlib demo") 
plt.xlabel("x axis caption") 
plt.ylabel("y axis caption") 
plt.plot(x,y,"ob") 
plt.show()```

#### 2.4 处理显示为方框问题


```python
#绘制正弦波

x = np.arange(0,  3  * np.pi,  0.1) 
y = np.sin(x)
plt.title("sine wave form")  
# 使用 matplotlib 来绘制点
plt.plot(x, y) 

# plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
plt.show()

2.5 subplot()与add_subplot()

subplot() 函数允许你在同一图中绘制不同的东西。

# 计算正弦和余弦曲线上的点的 x 和 y 坐标 
x = np.arange(0,  3  * np.pi,  0.1) 
y_sin = np.sin(x) 
y_cos = np.cos(x)  
# 建立 subplot 网格，高为 2，宽为 1  
# 激活第一个 subplot
plt.subplot(2,  1,  1)  
# 绘制第一个图像 
plt.plot(x, y_sin,'-.') 
plt.title('Sine')  
# 将第二个 subplot 激活，并绘制第二个图像
plt.subplot(2,  1,  2) 
plt.plot(x, y_cos,'1') 
plt.title('Cosine')  
# 展示图像
plt.show()

print(' ====分割线====  ')

plt.plot(x, y_sin,":") 
plt.plot(x, y_cos,'v') 
plt.title('Sine and Cosine') 
plt.show()

 ====分割线====

注意，pyplot的方式中plt.subplot()参数和面向对象中的add_subplot()参数和含义都相同。

使用面向对象的方式

x = np.arange(1, 100)
fig = plt.figure()
ax1 = fig.add_subplot(221)
ax1.plot(x, x)
ax2 = fig.add_subplot(222)
ax2.plot(x, -x)
ax3 = fig.add_subplot(223)
ax3.plot(x, x ** 2)
ax4 = fig.add_subplot(224)
ax4.plot(x, np.log(x))
plt.show()

pyplot的方式

x = np.arange(0, 100)
plt.subplot(221)
plt.plot(x, x)
plt.subplot(222)
plt.plot(x, -x)
plt.subplot(223)
plt.plot(x, x ** 2)
plt.subplot(224)
plt.plot(x, np.log(x))

备注：subplot(224)中参数221等价subplot(2,2,4),前者简写适用于参数0~9

2.6 bar() 条形图

x =  [5,8,10] 
y =  [12,16,6] 
x2 =  [6,8,11] 
y2 =  [6,20,7] 
plt.bar(x, y, align =  'center') 
plt.bar(x2, y2, color =  'g', align =  'center',alpha=0.6) #后画的图“覆盖”先画的图,alpha设置透明度
plt.title('Bar graph') 
plt.ylabel('Y axis') 
plt.xlabel('X axis') 
#很明显，这样分组画图十分不便。

Text(0.5, 0, 'X axis')

2.7 频数直方图

numpy.histogram()

numpy.histogram() 函数是数据的频率分布的图形表示。

水平尺寸相等的矩形对应于类间隔，称为 bin，变量 height 对应于频率。

numpy.histogram()函数将输入数组和 bin 作为两个参数。 bin 数组中的连续元素用作每个 bin 的边界。

示例2.7-1：

a = np.array([22,87,5,43,56,73,23,55,54,11,20,51,5,79,31,27])
np.histogram(a,bins =  [0,20,40,60,80,100]) 
hist,bins = np.histogram(a,bins =  [0,20,40,60,80,100])  
print (hist) 
print (bins)

[3 5 5 2 1]
[  0  20  40  60  80 100]

Matplotlib.pyplot.hist()

Matplotlib 可以将直方图的数字表示转换为图形。 pyplot 子模块的 plt() 函数将包含数据和 bin 数组的数组作为参数，并转换为直方图。

示例2.7-2：

a = np.array([22,87,5,43,56,73,55,54,11,20,51,5,79,31,27,88,99,97]) 
plt.hist(a, bins =  [0,20,40,60,80,100]) 
plt.title("histogram") 
plt.show()

2.8 常用参数（matplotlib）

# help(plt.figure().add_subplot) #多用help

设置图例位置

plt.legend(loc='best',bbox_to_anchor=(0.1,0.2))

String	Number
upper right	1
upper left	2
lower left	3
lower right	4
right	5
center left	6
center right	7
lower center	8
upper center	9
center	10

所以loc这个参数可以设置大概的图例位置，如果这就可以满足要求，那么第二个参数不要也行。

第二个参数bbox_to_anchor被赋予的二元组中，num1用于控制legend的左右移动，值越大越向右边移动，num2用于控制legend的上下移动，值越大，越向上移动。用于微调图例的位置。

# 本cell仅供参考，未实际验证。
def pass_c():
    if 2>1:
        pass
    else:
        fig = plt.figure(facecolor='white')
        ax1 = fig.add_subplot(211)
        # 可用MarkerEdgeColor或mec设置标记边缘颜色；MarkerFaceColor或mfc设置标记填充颜色;
        # MarkerSize设置标记大小 （这个点真心不好找，无意间看了一个无关的帖子瞅到了这个点）
        ax1.plot(true_data, marker='o', color='r', mec='r', mfc='w',label=u'真实值')  # r：红色 w：白色 g：绿色  b：蓝色  c：青绿色  m：洋红色  k：黑色
        ax1.plot(predicted_data, '+-', MarkerSize=8, color='k', mec='k', mfc='w', label=u'预测值')
        plt.setp(ax1.get_xticklabels(), visible=False) # 获得当前图像x轴，设置不可见
        plt.ylabel(u'y1轴标签', fontproperties=font) # 设置图中汉字，可解决汉字乱码问题
        plt.ylim(ymin=2)  # 设置当前图像y轴的最小值，根据需要设置
        ax1.legend(prop=font)  # 设在当前图像标签 ，两个子图避免覆盖，此处需设置当前子图的属性，不设置的话上面的两个label显示不出来

        ax2 = fig.add_subplot(212, sharex=ax1)  # 共享x轴
        ax2.bar(range(96), error_data, color='k')
        plt.xlabel(u'时间段', fontproperties=font)
        plt.ylabel(u'y2轴标签', fontproperties=font)
        plt.subplots_adjust(hspace=0)  # 设置两个子图的间距
        plt.ylim(ymax=110)  # 设置当前图像y轴的最大值
        plt.ylim(ymin=-110)  # 设置当前图像y轴的最小值

3.绘图的几个概念

3.1 分组绘图VS分面绘图

分组绘图

比如说需要在一张图上绘制两条曲线，分别是南方和北方的气温变化，分别用不同的颜色加以区分。在seaborn中用hue参数控制分组绘图。

分面绘图

其实就是在一张纸上划分不同的区域，比如2*2的子区域，在不同的子区域上绘制不同的图形，在matplotlib中就是 add_subplot(2,2,1)，在seaborn中用col参数控制，col的全称是columns，不是color，如果辅助col_wrap参数会更好些。后来发现，col可以控制columns的子图，那么row可以控制rows的子图排列。
如果需要分面绘图，应该使用seaborn的FacetGrid对象，seaborn的一般的绘图函数是没有分面这个参数的。

注：统计函数

分组绘图的时候，会对分组变量先要用统计函数，然后绘图，比如先计算变量的均值，然后绘制该均值的直方图。统计绘图参数是 estimator，很多情况下默认是numpy.mean。在R语言ggplot2中就大量使用了这种方法。如果不用统计绘图，就需要先用pandas进行groupby分组汇总，然后用seaborn绘图，多此一举了。

3.2 图形分类

在seaborn中图形大概分这么几类，因子变量绘图，数值变量绘图，两变量关系绘图，时间序列图，热力图，分面绘图等。

因子变量绘图

箱线图boxplot
小提琴图violinplot
散点图striplot
带分布的散点图swarmplot
直方图barplot
计数的直方图countplot
两变量关系图factorplot

回归图

回归图只要探讨两连续数值变量的变化趋势情况，绘制x-y的散点图和回归曲线。

线性回归图lmplot
线性回归图regplot

分布图

包括单变量核密度曲线，直方图，双变量多变量的联合直方图，和密度图

热力图

热力图heatmap

聚类图

聚类图clustermap

时间序列图

时间序列图tsplot
我的时序图plot_ts_d , plot_ts_m

分面绘图

1.分面绘图FacetGrid

4. Seaborn

import seaborn as sns

4.1 主题与配色

seaborn支持5种主题：

1.darkgrid（灰色网格）
2.whitegrid（白色网格）
3.dark（黑色）
4.white（白色）
5.ticks（十字叉）

# 设置主题
sns.set_style("darkgrid")

调色板参考链接

颜色主题有6种不同的风格: deep, muted, pastel, bright, dark和colorblind。

当你有6种以上颜色需要区分的时候,最为常见的方式是采用hls颜色空间，这是一个RGB值的简单转换:

sns.palplot(sns.color_palette("hls", 10))#palplot是创建调色板  color_palette（颜色空间，设置几种颜色块）
# sns.color_palette("hls", 10)

color_palette()能传入任何Matplotlib所支持的颜色
color_palette()不写参数则默认颜色
set_palette()设置所有图的颜色

（绘图时使用参数palette设置颜色）

4.2 常见图形

4.2.1 boxplot箱线图

tips = sns.load_dataset("tips") #导入sns内置数据集（在线连接）
tips.describe(include='all')
# tips.head(5)

	total_bill	tip	sex	smoker	day	time	size
count	244.000000	244.000000	244	244	244	244	244.000000
unique	NaN	NaN	2	2	4	2	NaN
top	NaN	NaN	Male	No	Sat	Dinner	NaN
freq	NaN	NaN	157	151	87	176	NaN
mean	19.785943	2.998279	NaN	NaN	NaN	NaN	2.569672
std	8.902412	1.383638	NaN	NaN	NaN	NaN	0.951100
min	3.070000	1.000000	NaN	NaN	NaN	NaN	1.000000
25%	13.347500	2.000000	NaN	NaN	NaN	NaN	2.000000
50%	17.795000	2.900000	NaN	NaN	NaN	NaN	2.000000
75%	24.127500	3.562500	NaN	NaN	NaN	NaN	3.000000
max	50.810000	10.000000	NaN	NaN	NaN	NaN	6.000000

# 绘制箱线图
ax = sns.boxplot(x=tips["total_bill"])
# 竖着放的箱线图，也就是将x换成y
# ax = sns.boxplot(y=tips["total_bill"])

# 分组绘制箱线图，分组因子是day，在x轴不同位置绘制（data为DataFrame格式，x、y对应赋值“字段”）
ax = sns.boxplot(x="day", y="total_bill", data=tips)

# 分组箱线图，分子因子是smoker，不同的因子用不同颜色区分
# 相当于分组之后又分组
ax = sns.boxplot(x="day", y="total_bill", hue="smoker",
                    data=tips,palette=sns.color_palette("hls", 2))

# 改变线宽，linewidth参数
ax = sns.boxplot(x="day", y="total_bill", hue="time",
                    data=tips,linewidth=5.2, palette='Set2')

# 改变x轴顺序，order参数
ax = sns.boxplot(x="time", y="tip", data=tips,
                    order=["Dinner", "Lunch"],palette='Set3')

# 对dataframe的每个变量都绘制一个箱线图，水平放置 orient='h'为水平的、默认为垂直的
iris = sns.load_dataset("iris")
ax = sns.boxplot(data=iris.iloc[:,[3,2,1,0]],orient="h", palette="Set3") 
# 注：每个数值型“字段”都自动分组,支持索引排序，但类似iris.iloc[:,[3,3,2,2]]的索引会出图错误。
iris.head(5)

	sepal_length	sepal_width	petal_length	petal_width	species
0	5.1	3.5	1.4	0.2	setosa
1	4.9	3.0	1.4	0.2	setosa
2	4.7	3.2	1.3	0.2	setosa
3	4.6	3.1	1.5	0.2	setosa
4	5.0	3.6	1.4	0.2	setosa

带分布密度的散点图+箱线图

# 箱线图+有分布趋势的散点图
# 图形组合也就是两条绘图语句一起运行就可以了，相当于图形覆盖了
ax = sns.boxplot(x="day", y="total_bill", data=tips)
ax = sns.swarmplot(x="day", y="total_bill", data=tips, color="0.2",alpha=0.6)

4.2.2 violinplot小提琴图

小提琴图其实是箱线图与核密度图的结合，箱线图展示了分位数的位置，小提琴图则展示了任意位置的密度，通过小提琴图可以知道哪些位置的密度较高。在图中，白点是中位数，黑色盒型的范围是下四分位点到上四分位点，细黑线表示须。外部形状即为核密度估计（在概率论中用来估计未知的密度函数，属于非参数检验方法之一）。

# 绘制小提琴图（x轴指定数据）
ax = sns.violinplot(x=tips["total_bill"],orient='v')#注：未指定y轴时，x轴默认横向，用orient='v'改为垂直
tips["total_bill"].head(5)

C:\ProgramData\Anaconda3\lib\site-packages\scipy\stats\stats.py:1713: FutureWarning: Using a non-tuple sequence for multidimensional indexing is deprecated; use `arr[tuple(seq)]` instead of `arr[seq]`. In the future this will be interpreted as an array index, `arr[np.array(seq)]`, which will result either in an error or a different result.
  return np.add.reduce(sorted[indexer] * weights, axis=axis) / sumval





0    16.99
1    10.34
2    21.01
3    23.68
4    24.59
Name: total_bill, dtype: float64

# 分组的小提琴图，同上面的箱线图一样通过X轴分组
ax = sns.violinplot(x="day", y="total_bill", data=tips)

# 通过hue分组的小提琴图，相当于分组之后又分组
ax = sns.violinplot(x="day", y="total_bill", hue="smoker",
                        data=tips, palette=sns.color_palette("hls", 2))

# 分组组合的小提琴图，其实就是hue分组后，各取一半组成一个小提琴图 :split=True
ax = sns.violinplot(x="day", y="total_bill", hue="smoker",
                        data=tips, palette=sns.color_palette("hls", 2),
                            split=True)
# ax=sns.swarmplot(x='day',y='total_bill',data=tips,hue='smoker',alpha=0.5) # 当然，可以叠加散点图

# 调整x轴顺序，同样通过order参数
ax = sns.violinplot(x="day", y="total_bill", hue="smoker",
                        data=tips, palette=sns.color_palette("hls", 2),split=True,
                                order=['Fri','Sat','Sun','Thur'])

4.2.3 散点图（stripplot、swarmplot 两种）

需要注意的是，seaborn中有两个散点图，一个是普通的散点图，另一个是可以看出分布密度的散点图。下面把它们花在一起就明白了。

tips["total_bill"].head(10)

0    16.99
1    10.34
2    21.01
3    23.68
4    24.59
5    25.29
6     8.77
7    26.88
8    15.04
9    14.78
Name: total_bill, dtype: float64

# 普通的散点图
ax1 = sns.stripplot(x=tips["total_bill"])

# 带分布密度的散点图
ax2 = sns.swarmplot(x=tips["total_bill"])

# 分组的散点图 #添加抖动,jitter可以是0.1,0.2...这样的小数，表示抖动的程度大小
ax = sns.stripplot(x="day", y="total_bill", data=tips,jitter=0.3)

# 是不是想横着放呢，很简单的，x-y顺序换一下就好了

# 重点来了，分组绘制，而且是分组后分开绘制，在柱状图中，跟分组柱状图类似的。
# 通过 hue, split 参数控制

# 1.分组
ax = sns.stripplot(x="sex", y="total_bill", hue="day",
                    data=tips, jitter=True)

# 2.分开绘制
ax = sns.stripplot(x="sex", y="total_bill", hue="day",
                    data=tips, jitter=True,dodge=True) #dodge是`split`被重命名了。

# help(sns.stripplot().legend)

swarmplt的参数和用法和stripplot的用法是一样的，只是表现形式不一样而已。

4.2.4 pointplot （显示点估计和置信区间）

基于 help(sns.pointplot)

点图代表散点图位置的数值变量的中心趋势估计，并使用误差线提供关于该估计的不确定性的一些指示。点图可能比条形图更有用于聚焦一个或多个分类变量的不同级别之间的比较。他们尤其善于表现交互作用：一个分类变量的层次之间的关系如何在第二个分类变量的层次之间变化。连接来自相同色调等级的每个点的线允许交互作用通过斜率的差异进行判断，这比对几组点或条的高度比较容易。具体用法如下：

seaborn.pointplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, estimator=(function mean), ci=95, n_boot=1000, units=None, markers=‘o’, linestyles=’-’, dodge=False, join=True, scale=1, orient=None, color=None, palette=None, errwidth=None, capsize=None, ax=None, **kwargs)

误差棒是以被测量的算术平均值为中点，在表示测量值大小的方向上画出的一个线段，线段长度的一半等于（标准或扩展）不确定度。它表示被测量以某一概率（68%或95%）落在棒上。

参数 ci=95为置信区间95%
参数 estimator=np.mean(指定点的统计函数)

tips.head(5)

	total_bill	tip	sex	smoker	day	time	size
0	16.99	1.01	Female	No	Sun	Dinner	2
1	10.34	1.66	Male	No	Sun	Dinner	3
2	21.01	3.50	Male	No	Sun	Dinner	3
3	23.68	3.31	Male	No	Sun	Dinner	2
4	24.59	3.61	Female	No	Sun	Dinner	4

sns.pointplot(x="time",y="size",data=tips,ci=68)

#点为这组数据的平均值点，竖线则为误差棒，默认两个均值点会相连接，若不想显示，可以通过join参数实现
sns.pointplot(x="time",y="size",data=tips,join=False)

# 同样的，hue分组，dodge分离
# markers控制均值点的样式，linestyles控制相同色调的点之间的连线
sns.pointplot(x="time",y="size",data=tips,hue='smoker',dodge=True,
              markers=["*","x"],linestyles=["-.","--"]) # 注意哪些用split，哪些用dodge
plt.legend(loc='lower left',bbox_to_anchor=(0.01,0.2)) #设置图例位置,一般用loc='best'，第二参数可省略

4.2.5 barplot 条形图

ax = sns.barplot(x="day", y="total_bill", data=tips,ci=95)
# 不显示条形图上面的置信度线，可以令置信区间参数ci=0

直方图的统计函数，默认绘制的是变量的均值 estimator=np.mean

# 要绘制变量中位数的条形图，由estimator指定统计函数
ax = sns.barplot(x="day", y="tip", data=tips, 
                    estimator=np.median, ci=0)

# 其他分组颜色等和前文图类似

4.2.6 countplot 计数图

countplot 故名思意，是“计数图”的意思，可将它认为一种应用到分类变量的直方图，也可认为它是用以比较类别间计数差，调用 count 函数的 barplot；
countplot 参数和 barplot 基本差不多，可以对比着记忆，有一点不同的是 countplot 中不能同时输入 x 和 y ，且 countplot 没有误差棒。

titanic = sns.load_dataset("titanic")
titanic.head(10)

	survived	pclass	sex	age	sibsp	parch	fare	embarked	class	who	adult_male	deck	embark_town	alive	alone
0	0	3	male	22.0	1	0	7.2500	S	Third	man	True	NaN	Southampton	no	False
1	1	1	female	38.0	1	0	71.2833	C	First	woman	False	C	Cherbourg	yes	False
2	1	3	female	26.0	0	0	7.9250	S	Third	woman	False	NaN	Southampton	yes	True
3	1	1	female	35.0	1	0	53.1000	S	First	woman	False	C	Southampton	yes	False
4	0	3	male	35.0	0	0	8.0500	S	Third	man	True	NaN	Southampton	no	True
5	0	3	male	NaN	0	0	8.4583	Q	Third	man	True	NaN	Queenstown	no	True
6	0	1	male	54.0	0	0	51.8625	S	First	man	True	E	Southampton	no	True
7	0	3	male	2.0	3	1	21.0750	S	Third	child	False	NaN	Southampton	no	False
8	1	3	female	27.0	0	2	11.1333	S	Third	woman	False	NaN	Southampton	yes	False
9	1	2	female	14.0	1	0	30.0708	C	Second	child	False	NaN	Cherbourg	yes	False

ax = sns.countplot(x="class", data=titanic)

4.2.7 catplot（按类型绘图）

原“factorplot”函数已重命名为“catplot”。原始名称将在未来的版本中删除。请更新您的代码。

catplot(x=None, y=None, hue=None, data=None, row=None, col=None, col_wrap=None, estimator=, ci=95, n_boot=1000, units=None, order=None, hue_order=None, row_order=None, col_order=None, kind=‘strip’, height=5, aspect=1, orient=None, color=None, palette=None, legend=True, legend_out=True, sharex=True, sharey=True, margin_titles=False, facet_kws=None, **kwargs)

参数kind:point默认，bar柱形图，count频次，box箱体，violin提琴，strip散点，swarm分散点

# help(sns.catplot)

titanic.head(10)
# titanic.describe(include='all')

	survived	pclass	sex	age	sibsp	parch	fare	embarked	class	who	adult_male	deck	embark_town	alive	alone
0	0	3	male	22.0	1	0	7.2500	S	Third	man	True	NaN	Southampton	no	False
1	1	1	female	38.0	1	0	71.2833	C	First	woman	False	C	Cherbourg	yes	False
2	1	3	female	26.0	0	0	7.9250	S	Third	woman	False	NaN	Southampton	yes	True
3	1	1	female	35.0	1	0	53.1000	S	First	woman	False	C	Southampton	yes	False
4	0	3	male	35.0	0	0	8.0500	S	Third	man	True	NaN	Southampton	no	True
5	0	3	male	NaN	0	0	8.4583	Q	Third	man	True	NaN	Queenstown	no	True
6	0	1	male	54.0	0	0	51.8625	S	First	man	True	E	Southampton	no	True
7	0	3	male	2.0	3	1	21.0750	S	Third	child	False	NaN	Southampton	no	False
8	1	3	female	27.0	0	2	11.1333	S	Third	woman	False	NaN	Southampton	yes	False
9	1	2	female	14.0	1	0	30.0708	C	Second	child	False	NaN	Cherbourg	yes	False

# 不同的deck（因子）绘制不同的alive（数值），col为分子图绘制，col_wrap每行画4个子图
g = sns.catplot(x="alive", col="deck", col_wrap=4,
                    data=titanic[titanic.deck.notnull()],
                    kind="count", height=2.5, aspect=.8)

# help(titanic.deck.notnull)
type(titanic.age.notnull)

method

4.3 回归图（regplot 、lmplot两种）

regplot：Plot data and a linear regression model fit（与线性回归模型拟合）。

lmplot： Plot data and regression model fits across a FacetGrid（回归模型适用于整个FacetGrid）

regplot适用线性回归拟合，lmplot用于robust回归、logistic、lowess（非参数回归）等；
很多时候，我们更关心两个变量变化是如何影响第三个变量的。这也是lmplot()与regplot()的区别之一。regplot()只能显示一对变量之间的关系，而lmplot()结合了regplot()与FacetGrid，提供了一个简单的接口，允许你探索最多其他三个分类变量的影响。

4.3.1 简单绘图

tips.head(5)

	total_bill	tip	sex	smoker	day	time	size
0	16.99	1.01	Female	No	Sun	Dinner	2
1	10.34	1.66	Male	No	Sun	Dinner	3
2	21.01	3.50	Male	No	Sun	Dinner	3
3	23.68	3.31	Male	No	Sun	Dinner	2
4	24.59	3.61	Female	No	Sun	Dinner	4

# 简单绘制regplot
sns.regplot(x="tip", y="total_bill", data=tips)
# 简单使用lmplot()
sns.lmplot(y="total_bill", x="tip", data=tips,markers='x')

# x_jitter 表示沿轴随机分布，相对避免重叠
sns.lmplot(x="size", y="tip", data=tips, x_jitter=.05)

sns.lmplot(x="size", y="tip", data=tips, x_estimator=np.mean)

4.3.2 拟合多种模型

# help(sns.lmplot)

anscombe = sns.load_dataset("anscombe")
anscombe[::-5]

	dataset	x	y
43	IV	8.0	6.89
38	IV	8.0	7.04
33	IV	8.0	6.58
28	III	6.0	6.08
23	III	8.0	6.77
18	II	4.0	3.10
13	II	13.0	8.74
8	I	12.0	10.84
3	I	9.0	8.81

# 原来数据还可以这样查询 anscombe.query("dataset == 'I'")
sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'I'"), ci=None, scatter_kws={"s": 50}) #scatter_kw控制散点大小
sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'II'"),ci=None, scatter_kws={"s":50})
sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'II'"),order=2, ci=None, scatter_kws={"s": 50})
sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'III'"),ci=None, scatter_kws={"s": 170})
# robust=True 使用 robust回归
sns.lmplot(x="x", y="y", data=anscombe.query("dataset == 'III'"),robust=True, ci=None, scatter_kws={"s": 180})

tips["big_tip"] = (tips.tip / tips.total_bill) > .15
# sns.lmplot(x="total_bill", y="big_tip", data=tips, y_jitter=.03)
# 使用逻辑回归
sns.lmplot(x="total_bill", y="big_tip", data=tips,logistic=True, y_jitter=.03)

# 非参数回归
sns.lmplot(x="total_bill", y="tip", data=tips,lowess=True)

# 绘制残差分布
sns.residplot(x="x", y="y", data=anscombe.query("dataset == 'I'"),scatter_kws={"s": 80},color='gray');

4.3.3 多变量关系

# 增加分类
# sns.lmplot(x="total_bill", y="tip", hue="smoker", data=tips)

# 横向增加时间变量
# sns.lmplot(x="total_bill", y="tip", hue="smoker", col="time", data=tips)

# 纵向增加性别变量
sns.lmplot(x="total_bill", y="tip", hue="smoker",col="time", row="sex", data=tips,height=5)

# sns.lmplot(x="total_bill", y="tip", hue="smoker",row="time", col="sex", data=tips)
# 分两行显示 col_wrap=2
# sns.lmplot(x="total_bill", y="tip", col="day",col_wrap=2,data=tips)

4.4 拟合方程【草稿】

4.4.1 多项式拟合

第一种是进行多项式拟合，数学上可以证明，任意函数都可以表示为多项式形式。具体示例如下。

x = [10,20,30,40,50,60,70,80]
x = np.array(x)
print('x is :\n',x)
num = [174,236,305,334,349,351,342,323]
y = np.array(num)
print('y is :\n',y)
#用3次多项式拟合
f1 = np.polyfit(x, y, 3)
print('f1 is :\n',f1)

p1 = np.poly1d(f1)
print('p1 is :\n',p1)
 
#也可使用yvals=np.polyval(f1, x)
yvals = p1(x)  #拟合y值
print('yvals is :\n',yvals)

plot1 = plt.plot(x, y, 's',label='original values')
plot2 = plt.plot(x, yvals, 'r',label='polyfit values')
plt.xlabel('x')
plt.ylabel('y')
plt.legend(loc=4) #指定legend的位置右下角
plt.title('polyfitting')

x is :
 [10 20 30 40 50 60 70 80]
y is :
 [174 236 305 334 349 351 342 323]
f1 is :
 [ 3.68686869e-04 -1.28701299e-01  1.10570707e+01  7.26428571e+01]
p1 is :
            3          2
0.0003687 x - 0.1287 x + 11.06 x + 72.64
yvals is :
 [170.71212121 245.25324675 298.47835498 332.5995671  349.82900433
 352.37878788 342.46103896 322.28787879]





Text(0.5, 1.0, 'polyfitting')

4.4.2 最小二乘法

第一种方案是给出具体的函数形式(可以是任意的，只要你能写的出来下面的func就是)，用最小二乘的方式去逼近和拟合，求出函数的各项系数，如下。

##使用curve_fit
from scipy.optimize import curve_fit

#自定义函数 e指数形式
def func(x, a, b,c):
    return a*np.sqrt(x)*(b*np.square(x)+c)

#定义x、y散点坐标
x = [20,30,40,50,60,70]
x = np.array(x)
num = [453,482,503,508,498,479]
y = np.array(num)

#非线性最小二乘法拟合
popt, pcov = curve_fit(func, x, y)
#获取popt里面是拟合系数
print(popt)
a = popt[0]
b = popt[1]
c = popt[2]
yvals = func(x,a,b,c) #拟合y值
print('popt:', popt)
print('系数a:', a)
print('系数b:', b)
print('系数c:', c)
print('系数pcov:', pcov)
print('系数yvals:', yvals)
#绘图
plot1 = plt.plot(x, y, 's',label='original values')
plot2 = plt.plot(x, yvals, 'r',label='polyfit values')
plt.xlabel('x')
plt.ylabel('y')
plt.legend(loc=4) #指定legend的位置右下角
plt.title('curve_fit')
plt.show()

[-1.96401671e-01  4.20401375e-02 -4.85953552e+02]
popt: [-1.96401671e-01  4.20401375e-02 -4.85953552e+02]
系数a: -0.19640167051933263
系数b: 0.042040137450105416
系数c: -485.95355159953976
系数pcov: [[-8.40140633e+10 -1.79833643e+10  2.07874670e+14]
 [-1.79833643e+10 -3.84937212e+09  4.44959544e+13]
 [ 2.07874670e+14  4.44959544e+13 -5.14341015e+17]]
系数yvals: [412.05987012 482.05616268 520.0763058  528.91733087 509.04771734
 460.0291367 ]

4.4.3 拟合高斯分布

#encoding=utf-8  
# import numpy as np
# import matplotlib.pyplot as plt
# from scipy.optimize import curve_fit
# import pandas as pd
import math

#自定义函数 e指数形式
def func(x, a,u, sig):
    return  a*(np.exp(-(x - u) ** 2 /(2* sig **2))/(math.sqrt(2*math.pi)*sig))*(431+(4750/x))

#定义x、y散点坐标
x = [40,45,50,55,60,65,70,75,80,85,90,95,100,105,110,115,120,125,130,135]
x=np.array(x)
# x = np.array(range(20))
print('x is :\n',x)
num = [536,529,522,516,511,506,502,498,494,490,487,484,481,478,475,472,470,467,465,463]
y = np.array(num)
print('y is :\n',y)

popt, pcov = curve_fit(func, x, y,p0=[3.1,4.2,3.3])
#获取popt里面是拟合系数
a = popt[0]
u = popt[1]
sig = popt[2]


yvals = func(x,a,u,sig) #拟合y值
print(u'系数a:', a)
print(u'系数u:', u)
print(u'系数sig:', sig)

#绘图
plot1 = plt.plot(x, y, 's',label='original values')
plot2 = plt.plot(x, yvals, 'r',label='polyfit values')
plt.xlabel('x')
plt.ylabel('y')
plt.legend(loc='best')
plt.title('curve_fit')
plt.show()

x is :
 [ 40  45  50  55  60  65  70  75  80  85  90  95 100 105 110 115 120 125
 130 135]
y is :
 [536 529 522 516 511 506 502 498 494 490 487 484 481 478 475 472 470 467
 465 463]
系数a: 3.1
系数u: 4.2
系数sig: 3.3


C:\ProgramData\Anaconda3\lib\site-packages\scipy\optimize\minpack.py:794: OptimizeWarning: Covariance of the parameters could not be estimated
  category=OptimizeWarning)

4.5 数值分布绘图

4.5.1.直方图histplot

默认：直方图hist=True，核密度曲线rug=True

sns.set(rc={"figure.figsize": (8, 4)}); np.random.seed(0)
x = np.random.randn(100)

# 绘制数值变量的密度分布图
# 默认既绘制核密度曲线，也绘制直方图
# ax = sns.distplot(x)

# 只绘制核密度曲线，不绘制直返图
# ax = sns.distplot(x, rug=True, hist=False)

# 横着放
ax = sns.distplot(x, vertical=True)

4.5.2.核密度图kdeplot

# import numpy as np; np.random.seed(10)
# import seaborn as sns; sns.set(color_codes=True)
mean, cov = [0, 2], [(1, .5), (.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, size=50).T #随机数生成

# 绘制核密度图
ax = sns.kdeplot(x)

# shade参数决定是否填充曲线下面积
# ax = sns.kdeplot(x, shade=True, color="r")

# 双变量密度图，相当于等高线图了
# shade 参数改用颜色深浅表示密度的大小，不过不用（就真的是等高线了）
ax = sns.kdeplot(x, y, shade=True)

# 分组绘制双变量的核密度图
# 相当于绘制两个核密度图，通过图可以看到密度中心
# 类似于挖掘算法中聚类中心绘图
iris = sns.load_dataset("iris")
setosa = iris.loc[iris.species == "setosa"]  # 组1
virginica = iris.loc[iris.species == "virginica"]  # 组2

ax = sns.kdeplot(setosa.sepal_width, setosa.sepal_length, 
                    cmap="Reds", shade=True, shade_lowest=False)

ax = sns.kdeplot(virginica.sepal_width, virginica.sepal_length, 
                    cmap="Blues", shade=True, shade_lowest=False)

4.5.3 热力图 heatmap

np.random.seed(0)
cmap = sns.diverging_palette(220, 10, as_cmap=True) # 设置配色
uniform_data = np.random.rand(5, 8)

ax = sns.heatmap(uniform_data,cmap=cmap,annot=True)  # annot：十分显示数值

# 改变颜色映射的值范围 vmin=0.2, vmax=0.6
ax = sns.heatmap(uniform_data,cmap=cmap,annot=True,vmin=0.5, vmax=0.6)

# Plot a dataframe with meaningful row and column labels:
flights = sns.load_dataset("flights")
flights = flights.pivot("month", "year", "passengers") # pivot 将 对应字段转化为 x-y-z结构（行-列-值）

# 绘制x-y-z的热力图，比如 年-月-销量 的热力图
cmap = sns.diverging_palette(220, 5, as_cmap=True) # 设置配色
ax = sns.heatmap(flights,cmap=cmap,annot=False,fmt="d") # fmt="d":添加注释时使用的字符串格式化代码

# xticklabels,yticklabels用来指定标签名称
np.random.seed(1)
data = pd.DataFrame(np.random.randn(8, 4))
data.columns=['a','b','c','d']
ax = sns.heatmap(data, xticklabels=['c','c','k'], yticklabels=['d','asd','dadw'],cmap=cmap,annot=True)

热力图可用户缺失值可视化，但数据量大时想要更直观，推荐一个**缺失值可视化包missingno**，这个包功能很简单，只有几个方法，使用起来也特别方便，不过它只能和pandas联合起来使用。

4.6 jointplot（双变量关系组图）

joint，顾名思义，就是联合呀。

Draw a plot of two variables with bivariate and univariate graphs.
(用双变量图和单变量图绘制一个由两个变量组成的图。)

重要参数：

kind参数可以使用不同的图形反应两变量的关系，比如点图，线图，核密度图。kind : { “scatter” | “reg” | “resid”(残差) | “kde” （等高线/核密度）| “hex” （六边形密度图）}, optional Kind of plot to draw.

space=0 "附图"间隔；height=5 正方形图边长, ratio=2 轴高比

# 默认绘制双变量的散点图，计算两个变量的直方图，计算两个变量的相关系数和置信度
# import numpy as np, pandas as pd; np.random.seed(0)
# import seaborn as sns; sns.set(style="white", color_codes=True)
tips = sns.load_dataset("tips")
g = sns.jointplot(x="total_bill", y="tip", data=tips)

# 使用六角形代替点图图
g = sns.jointplot("total_bill", "tip", data=tips, kind="hex")

# 绘制核密度图
iris = sns.load_dataset("iris")
g = sns.jointplot("sepal_width", "petal_length", data=iris, 
                    kind="kde", space=0, color="g")

# 控制图形的大小和颜色
g = sns.jointplot("total_bill", "tip", data=tips, 
                   height=5, ratio=5, color="g")

# help(sns.jointplot)

4.7 pairplot（成对关系组图）

Plot pairwise relationships in a dataset.（在数据集中绘制成对关系。）

# help(sns.pairplot)

iris.head(5)

	sepal_length	sepal_width	petal_length	petal_width	species
0	5.1	3.5	1.4	0.2	setosa
1	4.9	3.0	1.4	0.2	setosa
2	4.7	3.2	1.3	0.2	setosa
3	4.6	3.1	1.5	0.2	setosa
4	5.0	3.6	1.4	0.2	setosa

# import seaborn as sns; sns.set(style="ticks", color_codes=True)
# iris = sns.load_dataset("iris")
g = sns.pairplot(iris)

help(sns.pairplot)

Help on function pairplot in module seaborn.axisgrid:

pairplot(data, hue=None, hue_order=None, palette=None, vars=None, x_vars=None, y_vars=None, kind='scatter', diag_kind='auto', markers=None, height=2.5, aspect=1, dropna=True, plot_kws=None, diag_kws=None, grid_kws=None, size=None)
    Plot pairwise relationships in a dataset.
    
    By default, this function will create a grid of Axes such that each
    variable in ``data`` will by shared in the y-axis across a single row and
    in the x-axis across a single column. The diagonal Axes are treated
    differently, drawing a plot to show the univariate distribution of the data
    for the variable in that column.
    
    It is also possible to show a subset of variables or plot different
    variables on the rows and columns.
    
    This is a high-level interface for :class:`PairGrid` that is intended to
    make it easy to draw a few common styles. You should use :class:`PairGrid`
    directly if you need more flexibility.
    
    Parameters
    ----------
    data : DataFrame
        Tidy (long-form) dataframe where each column is a variable and
        each row is an observation.
    hue : string (variable name), optional
        Variable in ``data`` to map plot aspects to different colors.
    hue_order : list of strings
        Order for the levels of the hue variable in the palette
    palette : dict or seaborn color palette
        Set of colors for mapping the ``hue`` variable. If a dict, keys
        should be values  in the ``hue`` variable.
    vars : list of variable names, optional
        Variables within ``data`` to use, otherwise use every column with
        a numeric datatype.
    {x, y}_vars : lists of variable names, optional
        Variables within ``data`` to use separately for the rows and
        columns of the figure; i.e. to make a non-square plot.
    kind : {'scatter', 'reg'}, optional
        Kind of plot for the non-identity relationships.
    diag_kind : {'auto', 'hist', 'kde'}, optional
        Kind of plot for the diagonal subplots. The default depends on whether
        ``"hue"`` is used or not.
    markers : single matplotlib marker code or list, optional
        Either the marker to use for all datapoints or a list of markers with
        a length the same as the number of levels in the hue variable so that
        differently colored points will also have different scatterplot
        markers.
    height : scalar, optional
        Height (in inches) of each facet.
    aspect : scalar, optional
        Aspect * height gives the width (in inches) of each facet.
    dropna : boolean, optional
        Drop missing values from the data before plotting.
    {plot, diag, grid}_kws : dicts, optional
        Dictionaries of keyword arguments.
    
    Returns
    -------
    grid : PairGrid
        Returns the underlying ``PairGrid`` instance for further tweaking.
    
    See Also
    --------
    PairGrid : Subplot grid for more flexible plotting of pairwise
               relationships.
    
    Examples
    --------
    
    Draw scatterplots for joint relationships and histograms for univariate
    distributions:
    
    .. plot::
        :context: close-figs
    
        >>> import seaborn as sns; sns.set(style="ticks", color_codes=True)
        >>> iris = sns.load_dataset("iris")
        >>> g = sns.pairplot(iris)
    
    Show different levels of a categorical variable by the color of plot
    elements:
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris, hue="species")
    
    Use a different color palette:
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris, hue="species", palette="husl")
    
    Use different markers for each level of the hue variable:
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris, hue="species", markers=["o", "s", "D"])
    
    Plot a subset of variables:
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris, vars=["sepal_width", "sepal_length"])
    
    Draw larger plots:
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris, height=3,
        ...                  vars=["sepal_width", "sepal_length"])
    
    Plot different variables in the rows and columns:
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris,
        ...                  x_vars=["sepal_width", "sepal_length"],
        ...                  y_vars=["petal_width", "petal_length"])
    
    Use kernel density estimates for univariate plots:
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris, diag_kind="kde")
    
    Fit linear regression models to the scatter plots:
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris, kind="reg")
    
    Pass keyword arguments down to the underlying functions (it may be easier
    to use :class:`PairGrid` directly):
    
    .. plot::
        :context: close-figs
    
        >>> g = sns.pairplot(iris, diag_kind="kde", markers="+",
        ...                  plot_kws=dict(s=50, edgecolor="b", linewidth=1),
        ...                  diag_kws=dict(shade=True))

# 分组的变量关系图，似乎很厉害啊
g = sns.pairplot(iris, hue="species")

# hue 分组后，不同的组用不同的形状标记
# g = sns.pairplot(iris, hue="species", markers=["o", "s", "D"])

# 当然也可以只取dataframe中的一部分变量绘图
# g = sns.pairplot(iris, vars=["sepal_width", "sepal_length"])

# 对角线默认绘制直方图，当然也可以绘制核密度图
# g = sns.pairplot(iris, diag_kind="kde")

# 相应的，两变量关系图，也可以绘制线性回归图
# g = sns.pairplot(iris,kind='reg')

4.8 clustermap（聚类图）

Plot a matrix dataset as a hierarchically-clustered heatmap.(将矩阵数据集绘制为分层聚类的热图。)

参数：
继承sns.heatmap；data不为空的2D array-like；默认：method=‘average’, metric=‘euclidean’, z_score=None，…

# help(sns.clustermap)

# type(iris.iloc[:,0:4])
ax=sns.clustermap(iris.iloc[0:4,0:4],cmap=cmap,figsize=(8,8))

4.9 lineplot（时间序列图）

连续时间可以用matplotlib.pyplot.plot()，但可视效果欠佳，将时间转为数字再注释也麻烦；

时间序列绘图常用lineplot（替换原tsplot）。

lineplot(x=None, y=None, hue=None, size=None, style=None, data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, dashes=True, markers=None, style_order=None, units=None, estimator=‘mean’, ci=95, n_boot=1000, sort=True, err_style=‘band’, err_kws=None, legend=‘brief’, ax=None, **kwargs)

iris.head(4)

	sepal_length	sepal_width	petal_length	petal_width	species
0	5.1	3.5	1.4	0.2	setosa
1	4.9	3.0	1.4	0.2	setosa
2	4.7	3.2	1.3	0.2	setosa
3	4.6	3.1	1.5	0.2	setosa

ax=sns.lineplot(x='sepal_length',y='sepal_width',data=iris,hue='species')

这里重点讲一下。如果时序中每天的数据都有还好说，如果没有，就需要采样了。

4.10 双坐标轴

# import seaborn as sns
sale=pd.Series(np.random.random(10)*100).map(int)
tmperature=pd.Series(np.random.random(10)*10).map(int)

ax=plt.subplot(111)
sale.plot(ax=ax,color='b')
ax.set_xlabel('time')
ax.set_ylabel('sale')

# 重点来了，twinx 或者 twiny 函数
ax2 = ax.twinx()
tmperature.plot(ax=ax2,color='r')
ax2.set_ylabel('tmperature')
plt.title('double series figure')

Text(0.5, 1.0, 'double series figure')

5. 附言

批量保存

fig = plt.figure()
ax=fig.add_subplot(111)
sub_data[years].plot('绘图')
file = r'E:\xxx.jpg' %lev3
savefig(file)
time.sleep(0.5)  # 注意这里要暂停一下，不然会出问题的
plt.close()   # 最后记得关闭句柄

分段函数

这里借用panas.cut函数，因为是绘图看趋势，不需要精确得到每个分段的分割点。

# 先用pd.cut分段，并取出分段数值
# 通过 precision 控制小数的位数
data['cut_point']=pd.cut(data['age'], 
    bins=[0,3,5.9,8.9,11.9,14.8,17.8,20.8,23.8,26.7,29.7],  # 分割点
    labels=['0-3','3-5.9',......]    # 区间命名
    right=True,    # 区间默认是坐开右闭
    precision=1)

# 用sns画图，可以直接汇总每个分段的数量后绘图，而不需要groupby汇总
# 相当于回到前面，用barplot绘图
sns.barplot(x='cut_point',y='cnt', data=data, estimator=np.sum, ci=0)
plt.xlabel('这是横坐标名称')
plt.ylabel('这是纵坐标名称')
plt.title('这是图标标题')

FacetGrid 分面子图绘图

# 和上面的一样，先分组取出分割点

# 用pd.cut分段，并取出分段数值，通过 precision 控制小数的位数
data['bins']=pd.cut(data['age'], bins=10,precision=1)
# 取出分割点，因为cut后得到的是 '(2.99, 5.97]' 这样的字符串
data['cut_point']=data['bins'].apply(lambda x: eval(x.replace(']',')'))[1])

# 下面重点来了，用FacetGrid进行子图绘制
g=sns.FacetGrid(data=data,col='platform',col_wrap=3,size=5)   # 这里相当于groupby
g=g=g.map(sns.barplot,'cut_point','cnt',ci=0, estimator=np.sum)
# 很奇怪的是，如果写 
# g=g.map(sns.barplot,x='cut_point',y='cnt',ci=0, estimator=np.sum)就报错。

自定义子图

def my_barplot(x,y,**kwargs):
    """
    自定义函数的时候，没有显示传入dataframe，但是会自动获取，很神奇吧。(待验证)
    x,y是dataframe的列名
    """
    ax = plt.gca()  # 【这个是重点，获取对应的ax子图句柄】
    data['bins']=pd.cut(data['age'], bins=10,precision=1)
    data['cutpoint']=data['bins'].apply(lambda x: eval(x.replace(']', ')'))[1])
    sns.barplot(x='cutpoint', y='cnt',data=data, estimator=np.sum, ci=0, ax=ax)

g = sns.FacetGrid(data=data, col='platform',col_wrap=3,
                    size=5,sharex=False)
g = g.map(my_barplot,'age','cnt')

你可能感兴趣的:(python绘图,Python)

计算机毕业设计——springboot的准妈妈孕期交流平台
**欢迎来到琛哥的技术世界！**博主小档案：琛哥，一名来自世界500强的资深程序猿，毕业于国内知名985高校。技术专长：琛哥在深度学习任务中展现出卓越的能力，包括但不限于java、python等技术。近年来，琛哥更是将触角延伸至AI领域，对于机器学习、自然语言处理、智能推荐等前沿技术都有独到的见解和实践经验。博客亮点：琛哥坚信“授人以渔胜于授人以鱼”，因此我的博客中，你不仅可以找到关于技术的深入解
【Python】dateutil库宅男很神经 python 开发语言
第一章：dateutil时间，在计算机系统中扮演着核心角色。从日志记录、事件调度到金融交易、科学模拟，无处不在。Python的标准库datetime模块提供了处理日期和时间的基本能力。然而，在面对真实世界的复杂性和多样性时，datetime的功能常常显得捉襟见肘。例如，它难以直接解析各种非标准格式的日期字符串，无法进行灵活的相对时间计算（如“下个月的第三个星期二”），也缺乏对循环事件的强大支持。正
【bug】 jetson上opencv无法录制h264本地视频 lxmyzzs bug opencv 音视频
在JetsonOrinNX上无法使用opencv直接录制h264/h265视频流（h264格式的视频流才能在浏览器播放）解决：软件编码：需要源码编译opencv1.环境准备pipuninstallopencv-pythonsudoaptinstallbuild-essentialcmakegitpython3-devpython3-numpy\libavcodec-devlibavformat-d
【详细解析！】Python语法基础小新在学习 python python 开发语言
python基础语法1.优先级：在运算代码的时候，我们优先级是先乘除后加减注意：1.1：在python中，2/3=0.666666而不是0；在python里面的相除就是数学意义上的相除1.2：某一个结果为1.666666666665，而不是667，是因为我们在编程里面是一般是没有四舍五入的概念的；这个结果我们在代码里面称之为浮点数.IEE745标准，在这套规则下，我们在内存中表示浮点数的时候，可能
Python 大数据分析（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/5058e6970bd2a8d818ecc1f7f8fef74a译者：飞龙协议：CCBY-NC-SA4.0第六章：第五章处理缺失值和相关性分析学习目标到本章结束时，你将能够：使用PySpark检测和处理数据中的缺失值描述变量之间的相关性计算PySpark中两个或多个变量之间的相关性使用PySpark创建相关矩阵在本章中，我们将使用Iris数据集处理
Python机器学习：从零基础到项目实战 Yuner2000 Python 机器学习人工智能
目录第一部分：思想与基石——万法归宗，筑基问道第1章：初探智慧之境——机器学习世界观1.1何为学习？从人类学习到机器智能1.2机器学习的“前世今生”：一部思想与技术的演进史1.3为何是Python？——数据科学的“通用语”1.4破除迷思：AI是“神”还是“器”？第2章：工欲善其事——Python环境与核心工具链2.1“乾坤在握”：Anaconda与JupyterNotebook的安装与配置2.2“
python里class转换_python实现class对象转换成json/字典的方法八决子 python里class转换
python实现class对象转换成json/字典的方法发布于2016-03-2808:05:44|153次阅读|评论:0|来源:网友投递Python编程语言Python是一种面向对象、解释型计算机程序设计语言，由GuidovanRossum于1989年底发明，第一个公开发行版发行于1991年。Python语法简洁而清晰，具有丰富和强大的类库。它常被昵称为胶水语言，它能够把用其他语言制作的各种模块
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
《深入理解 Python 的对象构造机制：__new__ 与 __init__ 的本质区别与实战应用》清水白石008 开发语言学习笔记课程教程 python 开发语言
《深入理解Python的对象构造机制：new与init的本质区别与实战应用》引言：对象的诞生之谜在Python的面向对象编程中，我们习惯于使用__init__方法来初始化对象。但你是否曾注意到，还有一个鲜为人知却至关重要的魔法方法——__new__？它是对象构造过程的起点，掌控着类实例的真正创建。理解__new__与__init__的区别，不仅能帮助你掌握Python的对象模型，还能在构建不可变类
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
python基础语法复习04——函数洛华363 python python
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成文章目录python基础语法目录一、初识函数1.定义2.调用二、函数的传参1.位置传参2.关键词传参3.参数默认值4.可变位置参数5.可变关键词参数6.参数解包7.值传递与引用传递总结一、初识函数函数是Python中可重复使用的代码块，用于执行特定任务。通过将代码封装
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
python进行geeMap环境安装箭梭_ python
近期需要利用geemap搭建一个界面，试了一下相应环境的配置，踏了挺多坑，下面我给大家具体介绍一下geemap的环境搭建：（1）geemap是基于googleearthengine的接口进行开发的，在安装geemap之前，需要先进行earthengie包的安装，参考链接如下：https://zhuanlan.zhihu.com/p/29186942#comment-549701602?notifi
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
2023年NOC大赛创客智慧编程赛项Python 复赛模拟题（二）青少儿编程课堂少儿编程资料大全付费专栏 python numpy 开发语言 noc大赛真题 noc试题
题目来自：NOC大赛创客智慧编程赛项Python复赛模拟题(二)NOC大赛创客智慧编程赛项Python复赛模拟题（二）第一题：编写一个成绩评价系统，当输入语文、数学和英语三门课程成绩时，输出三门课程总成绩及其等级。(1)程序提示用户输入三个数字，数字分别表示语文、数学、英语分数，对应的变量名称是Chinese、Math、English,并计算三个分数的和(score)进行输出。注：input()函
【RS】GEE(Python)：大规模分析与导出数据
在前面的章节中，我们探讨了如何在GoogleEarthEngine(GEE)上进行数据加载、处理、分析和可视化。现在，我们将进一步扩展，探索如何处理大规模的数据集和执行复杂的分析任务。通过GEE的云计算能力，用户可以在全球范围内执行大规模的时空分析，并高效地将处理结果导出为所需的格式。大规模分析的基本原则在GEE中，大规模分析是通过ImageCollection和FeatureCollection
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
【Python篇】Python基础——04day.Python中运算（简单部分，如果会的可以直接跳过）
文章目录前言一.运算符1.1算术运算符1.2比较运算符1.3逻辑运算符1.4赋值运算符1.5位运算符1.6身份运算符1.7成员运算符1.8三目运算符1.9优先级二.表达式2.1算术表达式2.2比较表达式2.3逻辑表达式2.4赋值表达式2.5成员表达式2.6身份表达式2.7三元表达式2.8函数调用表达式三.推导式3.1列表推导式3.2字典推导式3.3集合推导式总结前言这一章写的是在python中会用
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
OpenCV稠密光流法可直接运行的例程（python） indrrra opencv python 人工智能
#dense_optical_flow.pyimportcv2importnumpyasnpimportargparsedefdense_optical_flow(method,video_path,params=[],to_gray=False):#读取视频cap=cv2.VideoCapture(video_path)#读取第一帧ret,old_frame=cap.read()#创建HSV并使
分布式锁特点、以及用python3实现redis分布式锁数据知道 python3案例和总结分布式 redis 数据库 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录一、Redis分布式锁核心原理1.1Redis锁机制1.2锁释放二、基础实现代码2.1使用`redis-py`客户端2.2分布式锁类三、使用示例3.1基础锁操作3.2装饰器模式四、高级特性实现4.1Redlock算法（高可用方案）五、生产环境最佳实践5.1锁粒度控制5.2异常处理5.3监控与调试5.4重试机制六、测试代码6.1并发测试6
php、go、python后端接口签名实现奇华智能后台开发 linux 签名接口安全
1.php实现/**生成签名，$args为请求参数，$key为私钥*/functionmakeSignature($args,$key){if(isset($args['sign'])){$oldSign=$args['sign'];unset($args['sign']);}else{$oldSign='';}ksort($args);$requestString='';foreach($arg
python第一次作业
1.技术面试题（1）TCP与UDP的区别是什么？**答：1.TCP是面向连接的协议，而UDP是元连接的协议2.TCP协议传输是可靠的，而UDP协议的传输是“尽力而为3.TCP是可以实现流控，而UDP不行4.TCP可以实现分段，而UDP不行5.TCP的传输速率较慢，占用资源较大，UDP传输速率快，占用资源小。TCP/UDP的应用场景不同TCP适合可靠性高的效率要求低的，UDP可靠性低，效率高。（2）
python www_hhhhhhh python java 面试
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程：是操作系统进行资源分配的基本单位，拥有独立的地址空间、进程控制块，每个进程之间相互隔离。例如，打开一个终端窗口会启动一个bash进程。线程：是操作系统调度的基本单位，隶属于进程，共享进程的资源，但有独立的线程控制块和栈。线程切换开销远小于进程。例如，一个Web服务器的单个进程中，多个线程可同时处理不同客户
Python lambda表达式：匿名函数的适用场景与限制梦幻南瓜 python python 服务器 linux
目录1.Lambda表达式概述1.1Lambda表达式的基本语法1.2简单示例2.Lambda表达式的核心特点2.1匿名性2.2简洁性2.3即时性2.4函数式编程特性3.Lambda表达式的适用场景3.1作为高阶函数的参数3.2简单的数据转换3.3条件筛选3.4GUI编程中的回调函数3.5Pandas数据处理4.Lambda表达式的限制4.1只能包含单个表达式4.2没有语句4.3缺乏文档字符串4.
【python】 www_hhhhhhh python 面试职场和发展
1.技术面试题（1）TCP与UDP的区别是什么？答：TCP（传输控制协议）和UDP（用户数据报协议）是两种常见的传输层协议，主要区别在于连接方式和可靠性。TCP是面向连接的协议，传输数据前需建立连接，通过三次握手确保连接可靠，传输过程中有确认、重传和顺序控制机制，保证数据完整、按序到达，适用于网页浏览、文件传输等对可靠性要求高的场景。UDP是无连接的协议，无需建立连接即可发送数据，不保证数据可靠传
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p