唛咦

seaborn 常用画图

python seaborn画图
以前觉得用markdown写图文混排的文字应该很麻烦，后来发现CSDN的markdown真是好用的。

在做分析时候，有时需要画几个图看看数据分布情况，但总记不住python的绘图函数。今天有空顺便整理下python的seaborn绘图函数库。
Seaborn其实是在matplotlib的基础上进行了更高级的API封装，从而使得作图更加容易，在大多数情况下使用seaborn就能做出很具有吸引力的图，而使用matplotlib能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充，而不是替代物。

seaborns是针对统计绘图的，方便啊。

一般来说，seaborn能满足数据分析90%的绘图需求，够用了，如果需要复杂的自定义图形，还是要matplotlit。这里也只是对seaborn官网的绘图API简单翻译整理下，对很多参数使用方法都没有说到，如果需要精细绘图，还是需要参照其seaborn的文档的。

这里简要介绍常用的图形，常用的参数，其精美程度不足以当做报告绘图，算是做笔记吧。

1.几个概念
如果使用过R语言的ggplot2绘图包，对分组分面，统计绘图等概念应该很熟悉，这里也介绍下。

1.1.分组绘图
比如说需要在一张图上绘制两条曲线，分别是南方和北方的气温变化，分别用不同的颜色加以区分。在seaborn中用hue参数控制分组绘图。

1.2.分面绘图
其实就是在一张纸上划分不同的区域，比如2*2的子区域，在不同的子区域上绘制不同的图形，在matplotlib中就是 add_subplot(2,2,1)，在seaborn中用col参数控制，col的全称是columns，不是color，如果辅助col_wrap参数会更好些。后来发现，col可以控制columns的子图，那么row可以控制rows的子图排列。
如果需要分面绘图，应该使用seaborn的FacetGrid对象，seaborn的一般的绘图函数是没有分面这个参数的。

1.3.统计函数
分组绘图的时候，会对分组变量先要用统计函数，然后绘图，比如先计算变量的均值，然后绘制该均值的直方图。统计绘图参数是 estimator，很多情况下默认是numpy.mean。在ggplot2中就大量使用了这种方法。如果不适用统计绘图，就需要先用pandas进行groupby分组汇总，然后用seaborn绘图，多此一举了。

2.图形分类
在seaborn中图形大概分这么几类，因子变量绘图，数值变量绘图，两变量关系绘图，时间序列图，热力图，分面绘图等。

因子变量绘图

箱线图boxplot
小提琴图violinplot
散点图striplot
带分布的散点图swarmplot
直方图barplot
计数的直方图countplot
两变量关系图factorplot
回归图
回归图只要探讨两连续数值变量的变化趋势情况，绘制x-y的散点图和回归曲线。

线性回归图lmplot
线性回归图regplot
分布图
包括单变量核密度曲线，直方图，双变量多变量的联合直方图，和密度图

热力图

热力图heatmap

聚类图

聚类图clustermap

时间序列图

时间序列图tsplot
我的时序图plot_ts_d , plot_ts_m

分面绘图
1.分面绘图FacetGrid

3.因子变量绘图
3.1.boxplot箱线图
import seaborn as sns
sns.set_style(“whitegrid”)
tips = sns.load_dataset(“tips”)

绘制箱线图

ax = sns.boxplot(x=tips[“total_bill”])

竖着放的箱线图，也就是将x换成y

ax = sns.boxplot(y=tips[“total_bill”])
1
2
3
4
5
6
7
这里写图片描述

分组绘制箱线图，分组因子是day，在x轴不同位置绘制

ax = sns.boxplot(x=“day”, y=“total_bill”, data=tips)
1
2
这里写图片描述

分组箱线图，分子因子是smoker，不同的因子用不同颜色区分

相当于分组之后又分组

ax = sns.boxplot(x=“day”, y=“total_bill”, hue=“smoker”,
data=tips, palette=“Set3”)
1
2
3
4
这里写图片描述

改变线宽，linewidth参数

ax = sns.boxplot(x=“day”, y=“total_bill”, hue=“time”,
data=tips, linewidth=2.5)

改变x轴顺序，order参数

ax = sns.boxplot(x=“time”, y=“tip”, data=tips,
order=[“Dinner”, “Lunch”])
1
2
3
4
5
6
7

对dataframe的每个变量都绘制一个箱线图，水平放置

iris = sns.load_dataset(“iris”)
ax = sns.boxplot(data=iris, orient=“h”, palette=“Set2”)
1
2
3
这里写图片描述

箱线图+有分布趋势的散点图–>的组合图

箱线图+有分布趋势的散点图

图形组合也就是两条绘图语句一起运行就可以了，相当于图形覆盖了

ax = sns.boxplot(x=“day”, y=“total_bill”, data=tips)
ax = sns.swarmplot(x=“day”, y=“total_bill”, data=tips, color=".25")
1
2
3
4
这里写图片描述

3.2.violinplot小提琴图
小提琴图其实是箱线图与核密度图的结合，箱线图展示了分位数的位置，小提琴图则展示了任意位置的密度，通过小提琴图可以知道哪些位置的密度较高。在图中，白点是中位数，黑色盒型的范围是下四分位点到上四分位点，细黑线表示须。外部形状即为核密度估计（在概率论中用来估计未知的密度函数，属于非参数检验方法之一）。

import seaborn as sns
sns.set_style(“whitegrid”)
tips = sns.load_dataset(“tips”)

绘制小提琴图

ax = sns.violinplot(x=tips[“total_bill”])
1
2
3
4
5
这里写图片描述

分组的小提琴图，同上面的箱线图一样通过X轴分组

ax = sns.violinplot(x=“day”, y=“total_bill”, data=tips)
1
2
这里写图片描述

通过hue分组的小提琴图，相当于分组之后又分组

ax = sns.violinplot(x=“day”, y=“total_bill”, hue=“smoker”,
data=tips, palette=“muted”)
1
2
3
这里写图片描述

分组组合的小提琴图，其实就是hue分组后，各取一半组成一个小提琴图

ax = sns.violinplot(x=“day”, y=“total_bill”, hue=“smoker”,
data=tips, palette=“muted”, split=True)
1
2
3
这里写图片描述

调整x轴顺序，同样通过order参数

ax = sns.violinplot(x=“time”, y=“tip”, data=tips,
order=[“Dinner”, “Lunch”])
1
2
3
这里写图片描述

其他的样式不常用，就不贴上来了。

3.3.stripplot散点图
需要注意的是，seaborn中有两个散点图，一个是普通的散点图，另一个是可以看出分布密度的散点图。下面把它们花在一起就明白了。

普通的散点图

ax1 = sns.stripplot(x=tips[“total_bill”])

带分布密度的散点图

ax2 = sns.swarmplot(x=tips[“total_bill”])
1
2
3
4
这里写图片描述

分组的散点图

ax = sns.stripplot(x=“day”, y=“total_bill”, data=tips)
1
2
这里写图片描述

添加抖动项的散点图，jitter可以是0.1,0.2…这样的小数，表示抖动的程度大小

ax = sns.stripplot(x=“day”, y=“total_bill”, data=tips, jitter=True)
1
2
这里写图片描述

是不是想横着放呢，很简单的，x-y顺序换一下就好了

ax = sns.stripplot(x=“total_bill”, y=“day”, data=tips,jitter=True)
1
2
这里写图片描述

重点来了，分组绘制，而且是分组后分开绘制，在柱状图中，跟分组柱状图类似的。

通过 hue, split 参数控制

1.分组

ax = sns.stripplot(x=“sex”, y=“total_bill”, hue=“day”,
data=tips, jitter=True)

2.分开绘制

ax = sns.stripplot(x=“day”, y=“total_bill”, hue=“smoker”,
data=tips, jitter=True,palette=“Set2”, split=True)
1
2
3
4
5
6
7
8
这里写图片描述
这里写图片描述

散点图+小提起图

两条命令一起运行就行了

ax = sns.violinplot(x=“day”, y=“total_bill”, data=tips,inner=None, color=".8")
ax = sns.stripplot(x=“day”, y=“total_bill”, data=tips,jitter=True)
1
2
3
4
这里写图片描述

3.4.swarmplot带分布的散点图
swarmplt的参数和用法和stripplot的用法是一样的，只是表现形式不一样而已。

import seaborn as sns
sns.set_style(“whitegrid”)
tips = sns.load_dataset(“tips”)
ax = sns.swarmplot(x=tips[“total_bill”])
1
2
3
4
这里写图片描述

分组的散点图

ax = sns.swarmplot(x=“day”, y=“total_bill”, data=tips)
1
2
这里写图片描述

箱线图+散点图

whis 参数设定是否显示箱线图的离群点，whis=np.inf 表示不显示

ax = sns.boxplot(x=“tip”, y=“day”, data=tips, whis=np.inf)
ax = sns.swarmplot(x=“tip”, y=“day”, data=tips)
1
2
3
4
这里写图片描述

小提琴图+散点图

ax = sns.violinplot(x=“day”, y=“total_bill”, data=tips, inner=None)
ax = sns.swarmplot(x=“day”, y=“total_bill”, data=tips,
color=“white”, edgecolor=“gray”)
1
2
3
4
这里写图片描述

3.5.pointplot
Show point estimates and confidence intervals using scatter plot glyphs.
使用散点图符号显示点估计和置信区间。

这个我不知道在什么地方用到，不太明白。就先写这个了。

3.6.barplot直方图
我不喜欢显示直方图上面的置信度线，难看，所以下面的图形我都设置ci=0.(Size of confidence intervals to draw around estimated values)

直方图的统计函数，绘制的是变量的均值 estimator=np.mean

注意看看Y轴，看到没，统计函数默认是 mean，

import seaborn as sns
sns.set_style(“whitegrid”)
tips = sns.load_dataset(“tips”)
ax = sns.barplot(x=“day”, y=“total_bill”, data=tips,ci=0)
1
2
3
4
5
这里写图片描述

分组的柱状图

ax = sns.barplot(x=“day”, y=“total_bill”, hue=“sex”, data=tips,ci=0)
1
2
这里写图片描述

绘制变量中位数的直方图，estimator指定统计函数

from numpy import median
ax = sns.barplot(x=“day”, y=“tip”, data=tips,
estimator=median, ci=0)
1
2
3
4
这里写图片描述

改变主题颜色

palette=“Blues_d”

ax = sns.barplot(“size”, y=“total_bill”, data=tips,
palette=“Blues_d”)
1
2
3
4
这里写图片描述

3.7.countplot计数统计图
这个很重要，对因子变量计数，然后绘制条形图

import seaborn as sns
sns.set(style=“darkgrid”)
titanic = sns.load_dataset(“titanic”)
ax = sns.countplot(x=“class”, data=titanic)
1
2
3
4
这里写图片描述

分组绘图

ax = sns.countplot(x=“class”, hue=“who”, data=titanic)

如果是横着放，x用y替代

ax = sns.countplot(y=“class”, hue=“who”, data=titanic)
1
2
3
4
5
这里写图片描述

3.8.factorplot
这是一类重要的变量联合绘图。
绘制因子变量-数值变量的分布情况图。

用小提琴图反应 time-pulse 两变量的分布情形

import seaborn as sns
sns.set(style=“ticks”)
exercise = sns.load_dataset(“exercise”)
g = sns.factorplot(x=“time”, y=“pulse”, hue=“kind”,
data=exercise, kind=“violin”)
1
2
3
4
5
6
这里写图片描述

不同的deck（因子）绘制不同的alive（数值），col为分子图绘制，col_wrap每行画4个子图

titanic = sns.load_dataset(“titanic”)
g = sns.factorplot(x=“alive”, col=“deck”, col_wrap=4,
data=titanic[titanic.deck.notnull()],
kind=“count”, size=2.5, aspect=.8)
1
2
3
4
5
这里写图片描述

4.回归图
回归图有两个，我暂时没有看出他们有什么区别，从函数说明来看看吧。
lmplot： Plot data and regression model fits across a FacetGrid.
regplot：Plot data and a linear regression model fit.

4.1.回归图lmplot

线性回归图

import seaborn as sns; sns.set(color_codes=True)
tips = sns.load_dataset(“tips”)
g = sns.lmplot(x=“total_bill”, y=“tip”, data=tips)
1
2
3
4
这里写图片描述

分组的线性回归图，通过hue参数控制

g = sns.lmplot(x=“total_bill”, y=“tip”, hue=“smoker”, data=tips)
1
2
这里写图片描述

分组绘图，不同的组用不同的形状标记

g = sns.lmplot(x=“total_bill”, y=“tip”, hue=“smoker”,
data=tips,markers=[“o”, “x”])
1
2
3
这里写图片描述

不仅分组，还分开不同的子图绘制，用col参数控制

g = sns.lmplot(x=“total_bill”, y=“tip”, col=“smoker”, data=tips)
1
2
这里写图片描述

col+hue 双分组参数，既分组，又分子图绘制，jitter控制散点抖动程度

g = sns.lmplot(x=“size”, y=“total_bill”, hue=“day”,
col=“day”,data=tips, aspect=.4, x_jitter=.1)
1
2
3
这里写图片描述

分组绘制，控制size尺寸

g = sns.lmplot(x=“total_bill”, y=“tip”, col=“day”, hue=“day”,
data=tips, col_wrap=2, size=3)
1
2
3
这里写图片描述

既然col可以控制分组子图的，那么row也是可以控制分组子图的

g = sns.lmplot(x=“total_bill”, y=“tip”, row=“sex”,
col=“time”, data=tips, size=3)
1
2
3
这里写图片描述

4.2.回归图regplot
Plot the relationship between two variables in a DataFrame:

import seaborn as sns; sns.set(color_codes=True)
tips = sns.load_dataset(“tips”)
ax = sns.regplot(x=“total_bill”, y=“tip”, data=tips)
1
2
3
这里写图片描述

控制散点的形状和颜色

import numpy as np; np.random.seed(8)
mean, cov = [4, 6], [(1.5, .7), (.7, 1)]
x, y = np.random.multivariate_normal(mean, cov, 80).T
ax = sns.regplot(x=x, y=y, color=“g”, marker="+")
1
2
3
4
5
这里写图片描述

控制回归的置信度，你会看到拟合直线的外面的面积的有变化的

ax = sns.regplot(x=x, y=y, ci=68)
1
2
这里写图片描述

上面的都是拟合一次曲线，拟合二次曲线通过order=2设置，

拟合一次曲线相当于 order=1

ans = sns.load_dataset(“anscombe”)
ax = sns.regplot(x=“x”, y=“y”, data=ans.loc[ans.dataset == “II”],
scatter_kws={“s”: 80},order=2, ci=None, truncate=True)
1
2
3
4
5
这里写图片描述

5.数值分布绘图
5.1.直方图histplot
直方图hist=True，核密度曲线rug=True

绘制数值变量的密度分布图

默认既绘制核密度曲线，也绘制直方图

import seaborn as sns, numpy as np
sns.set(rc={“figure.figsize”: (8, 4)}); np.random.seed(0)
x = np.random.randn(100)
ax = sns.distplot(x)
1
2
3
4
5
6
这里写图片描述

只绘制核密度曲线，不绘制直返图

ax = sns.distplot(x, rug=True, hist=False)
1
2
这里写图片描述

横着放

ax = sns.distplot(x, vertical=True)
1
2
这里写图片描述

5.2.核密度图kdeplot

绘制核密度图

import numpy as np; np.random.seed(10)
import seaborn as sns; sns.set(color_codes=True)
mean, cov = [0, 2], [(1, .5), (.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, size=50).T
ax = sns.kdeplot(x)
1
2
3
4
5
6
这里写图片描述

shade参数决定是否填充曲线下面积

ax = sns.kdeplot(x, shade=True, color=“r”)
1
2
这里写图片描述

双变量密度图，相当于等高线图了

shade 参数改用颜色深浅表示密度的大小，不过不用，就真的是等高线了

ax = sns.kdeplot(x, y, shade=True)
1
2
3
这里写图片描述

分组绘制双变量的核密度图

相当于绘制两个核密度图，通过图可以看到密度中心

类似于挖掘算法中聚类中心绘图

iris = sns.load_dataset(“iris”)
setosa = iris.loc[iris.species == “setosa”] # 组1
virginica = iris.loc[iris.species == “virginica”] # 组2

ax = sns.kdeplot(setosa.sepal_width, setosa.sepal_length,
cmap=“Reds”, shade=True, shade_lowest=False)

ax = sns.kdeplot(virginica.sepal_width, virginica.sepal_length,
cmap=“Blues”, shade=True, shade_lowest=False)
1
2
3
4
5
6
7
8
9
10
11
12
这里写图片描述

5.3.双变量关系图jointplot
joint，顾名思义，就是联合呀。
Draw a plot of two variables with bivariate and univariate graphs.

kind参数可以使用不同的图形反应两变量的关系，比如点图，线图，核密度图。

默认绘制双变量的散点图，计算两个变量的直方图，计算两个变量的相关系数和置信度

import numpy as np, pandas as pd; np.random.seed(0)
import seaborn as sns; sns.set(style=“white”, color_codes=True)
tips = sns.load_dataset(“tips”)
g = sns.jointplot(x=“total_bill”, y=“tip”, data=tips)
1
2
3
4
5
这里写图片描述

通过kind参数，除了绘制散点图，还要绘制拟合的直线，拟合的核密度图

g = sns.jointplot(“total_bill”, “tip”, data=tips, kind=“reg”)
1
2
这里写图片描述

使用六角形代替点图图

g = sns.jointplot(“total_bill”, “tip”, data=tips, kind=“hex”)
1
2
这里写图片描述

绘制核密度图

iris = sns.load_dataset(“iris”)
g = sns.jointplot(“sepal_width”, “petal_length”, data=iris,
kind=“kde”, space=0, color=“g”)
1
2
3
4
这里写图片描述

控制图形的大小和颜色

g = sns.jointplot(“total_bill”, “tip”, data=tips,
size=5, ratio=3, color=“g”)
1
2
3
这里写图片描述

5.4.变量关系组图pairplot
就是绘制dataframe中各个变量两两之间的关系图。
在变量关系图中，最常见的就是 x-y的线图，x-y的散点图，x-y的回归图。其实这三者都可以通过lmplot绘制，只是控制不同的参数而已。x-y的线图，其实就是时间序列图，这里就不说了。
这里又说一遍散点图，是为了和前面的因子变量散点图相区分，前面的因子变量散点图，讲的是不同因子水平的值绘制的散点图，而这里是两个数值变量值散点图关系。为什么要用lmplot呢，说白了就是，先将这些散点画出来，然后在根据散点的分布情况拟合出一条直线。但是用lmplot总觉得不好，没有用scatter来得合适。

x-y 的散点图，不画回归线，fit_reg=False

tips = sns.load_dataset(“tips”)
g = sns.lmplot(x=“total_bill”, y=“tip”, data=tips,
fit_reg=False,hue=‘smoker’,scatter=True)

只画回归线，不画散点图，scatter=False

g = sns.lmplot(x=“total_bill”, y=“tip”, data=tips,
fit_reg=True,hue=‘smoker’,scatter=False)
1
2
3
4
5
6
7
8
9
这里写图片描述
这里写图片描述

import seaborn as sns; sns.set(style=“ticks”, color_codes=True)
iris = sns.load_dataset(“iris”)
g = sns.pairplot(iris)
1
2
3
这里写图片描述

分组的变量关系图，似乎很厉害啊

g = sns.pairplot(iris, hue=“species”)
1
2
这里写图片描述

hue 分组后，不同的组用不同的形状标记

g = sns.pairplot(iris, hue=“species”, markers=[“o”, “s”, “D”])
1
2
这里写图片描述

当然也可以只取dataframe中的一部分变量绘图

g = sns.pairplot(iris, vars=[“sepal_width”, “sepal_length”])
1
2
这里写图片描述

对角线默认绘制直方图，当然也可以绘制核密度图

g = sns.pairplot(iris, diag_kind=“kde”)

相应的，两变量关系图，也可以绘制线性回归图

1
2
3
这里写图片描述

这里写图片描述

6.热力图
6.1.热力图heatmap
import numpy as np; np.random.seed(0)
import seaborn as sns; sns.set()
uniform_data = np.random.rand(10, 12)
ax = sns.heatmap(uniform_data)
1
2
3
4
这里写图片描述

改变颜色映射的值范围

ax = sns.heatmap(uniform_data, vmin=0, vmax=1)
1
2
这里写图片描述

Plot a dataframe with meaningful row and column labels:

绘制x-y-z的热力图，比如年-月-销量的热力图

flights = sns.load_dataset(“flights”)
flights = flights.pivot(“month”, “year”, “passengers”)
ax = sns.heatmap(flights)
1
2
3
4
5
这里写图片描述

绘制热力图，还要将数值写到热力图上

ax = sns.heatmap(flights, annot=True, fmt=“d”)
1
2
这里写图片描述

这个图在绘制缺失值分布有用，但是不知道怎么样。

Plot every other column label and don’t plot row labels

data = np.random.randn(50, 20)
ax = sns.heatmap(data, xticklabels=2, yticklabels=False)
1
2
3
4
这里写图片描述

7.聚类图clustermap
暂时不知道怎么用，先这样吧。

8.时间序列图
tsplot函数说是绘制时间序列图，还不如说是绘制简单的线图更加合适吧，因为我在绘制带timestap时间索引的pandas.Series时，并没有自动升采样绘图，只是数据有有什么数据就画什么，这在时间序列上应该是不对的。

因为我遇到这样一种情况，一个产品只在上半年卖，从数据库中取出数据只有每年上半年的数据，下半年没有数据也应该填充为0才对啊，但是seaborn的tsplot没有这个功能。

下面先介绍tsplot绘制线图吧，传入一个list或者series，直接绘制线图。

8.1.tsplot时序图

Plot a trace with translucent confidence bands:

绘制带有半透明置信带的轨迹：

data是多组list的组合，这时候应该绘制多条曲线才对啊，其实不是的，是多组list的均值的序列图（默认）

import numpy as np; np.random.seed(22)
import seaborn as sns; sns.set(color_codes=True)
x = np.linspace(0, 15, 31)
data = np.sin(x) + np.random.rand(10, 31) + np.random.randn(10, 1)
ax = sns.tsplot(data=data)
1
2
3
4
5
6
7
8
这里写图片描述

tsplot的参数不太懂，直接上图吧

gammas = sns.load_dataset(“gammas”)
ax = sns.tsplot(time=“timepoint”, value=“BOLD signal”,
unit=“subject”, condition=“ROI”, data=gammas)
1
2
3
4
这里写图片描述

绘制不同的置信度拟合图，这个好用

ax = sns.tsplot(data=data, ci=[68, 95], color=“m”)
1
2
这里写图片描述

使用不同的统计函数，默认的是均值，这里是中位数

ax = sns.tsplot(data=data, estimator=np.median)
1
2
这里写图片描述

8.2.panda线图
pandas的dataframe本身也有绘图函数，对于常见的分析图形还是很方便的，而且可以在plot函数中指定title等

sale4.loc[sale4[‘sku’]==‘SKU412946’,[‘month’,‘salecount’]]
.plot(x=‘month’,y=‘salecount’,title=‘SKU412946’)
1
2
这里写图片描述

8.3.采样的时序图
这里重点讲一下。如果时序中每天的数据都有还好说，如果没有，就需要采样了。

def plot_ts_day(x,y):
“”“绘制每天的时间序列图。
需要注意的是，序列是不是连续的，也就是说某天的数据是没有的,因此需要采样至每天都有记录，原来数据没有的就填充0
x:时间轴，string或者time类型,是一个seires
y:值
“””
# x转成时间类型Timestamp，y也转成list
x=[pd.to_datetime(str(i)) for i in x]
y=[i for i in y]
s=pd.Series(y,index=x)
s = s.resample(rule=‘D’,fill_method=‘ffill’) # 生采样没有的会被填充
# 原来没有的就填充为0
s[s.index]=0
s[x]=y
# 重建索引，画出来的图好看点
x2 = [i.strftime(’%Y-%m-%d’) for i in s.index]
s.index = x2
# 画图，这里使用series的plot函数，而不是seaborn.tsplot函数
s.plot()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
这里写图片描述

def plot_ts_month(x,y):
“”“绘制月的时间序列图，每月一个数据点，而不是每天一个”""
# 将x转成时间类型timestamp,y也转成list
try:
x = [pd.to_datetime(str(i)) for i in x]
except:
x=[pd.to_datetime(str(i)+‘01’) for i in x]
y=[i for i in y]
#
s=pd.Series(y,index=x)
# 降采样至月
s = s.resample(‘M’, label=‘right’).sum().fillna(0)
# 重建索引，这样画出来的图好看点
s.index=[i.strftime(’%Y%m’) for i in s.index]
s.plot()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
这里写图片描述

8.4.pandas分组的线图
说实话，到现在还没搞懂怎么用sns.tsplot绘制分组线图，但是任务紧急，就用pandas的dataframe自带方法plot来绘图了，其实也挺简单的。
主要注意的是，尽量给dataframe或者series建立时间索引，不然x轴很难看的。

绘制月销量图

数据如下

year month2 salecount

2014 1 531

2014 2 505

建立索引，‘201601’

data.index = data[‘year’].map(str)+data[‘month2’].map(lambda x: str(x) if x>=10 else ‘0’+str(x))

绘图，其实也就是和8.3的方法一致了

data[‘salecount’].plot()
1
2
3
4
5
6
7
8
9
10
分组的线图，比如seaborn中的hue参数，方法是，先将dataframe长表格式转成宽表格式（透视表），每列是不同的年。

分组的线图

转成透视表后，绘图

data.pivot(index=‘month2’,columns=‘year’,values=‘salecount’).plot(title=‘销量’)

当数据很大的时候，你想绘制分组的统计图，比如将不同产品，相同的年月的销量进行加或者均值后在绘制线图

使用 aggfunc 参数即可，默认是mean

data.pivot_table(index=‘month2’,columns=‘year’,values=‘salecount’,aggfunc=‘sum’)
.plot(title=‘销量’,style=‘o-’)
1
2
3
4
5
6
7
8
这里写图片描述

图形格式选项

图形参数

style

图形的属性

1.color:颜色

1.1 r：红色

1.2 b：蓝色

1.3 g：绿色

1.3 y：黄色

2.数据标记markder

2.1 o：圆圈

2.2 .：圆点

2.2 d：棱形

3.线型linestyle

3.1 没有参数的话就是默认画点图

3.2 --：虚线

3.3 -：实线

4.透明度

alpha

5.大小

size

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

绘 “点-线” 图

data.pivot(index=‘month2’,columns=‘year’,values=‘salecount’)
.plot(title=‘销量’,style=’-o’)
1
2
3
这里写图片描述

9.双坐标轴图
有没有遇到这样一种情况，需要将销量和趋势图和温度的变化图同时画在一幅图上，以便观察两者的趋势变化情况，但是因两者是数值差距很大，如果共用同一Y轴，温度曲线就基本看不到了。还是上图上代码吧。

import seaborn as sns
sale=pd.Series(np.random.random(10)*100).map(int)
tmperature=pd.Series(np.random.random(10)*10).map(int)

ax=plt.subplot(111)
sale.plot(ax=ax,color=‘b’)
ax.set_xlabel(‘time’)
ax.set_ylabel(‘sale’)

重点来了，twinx 或者 twiny 函数

ax2 = ax.twinx()
tmperature.plot(ax=ax2,color=‘r’)
ax2.set_ylabel(‘tmperature’)
plt.title(‘double series figure’)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
这里写图片描述

9.一些技巧
9.1 批量保存图片
如果只有一张图片，这没什么好说的，但是如果要对每个维度绘图，然后保存图片呢。

fig = plt.figure()
ax=fig.add_subplot(111)
sub_data[years].plot(ax=ax, style=‘o-’,title=’%s 月销量趋势图’%lev3)
file = r’E:\服装预测\销量趋势-%s.jpg’ %lev3
savefig(file)
time.sleep(0.5) # 注意这里要暂停一下，不然会出问题的
plt.close() # 最后记得关闭句柄
1
2
3
4
5
6
7
9.2 显示中文问题
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib.pyplot import savefig

mpl.rcParams[‘font.sans-serif’] = [‘SimHei’] # 指定默认字体
mpl.rcParams[‘axes.unicode_minus’] = False # 解决保存图像是负号’-'显示为方块的问题
1
2
3
4
5
6
7
8
10.分段统计绘图
遇到这样一种情况，如下的数据格式，现在platform不是重点，需要对diff_date字段分段汇总然后绘图。

platform age cnt

2 0 22

2 0 40

4 0.1 47

5 0.1 48

3 0.1 51

1
2
3
4
5
6
这里借用panas.cut函数，因为是绘图看趋势，不需要精确得到每个分段的分割点。

cut函数有两种使用方法，如果bins=10这样的数值，则将series切成等间隔的10段，如果bins=[0,5,20,55…]这样的一个列表，则根据列表规则切分。

先用pd.cut分段，并取出分段数值

通过 precision 控制小数的位数

data[‘cut_point’]=pd.cut(data[‘age’],
bins=[0,3,5.9,8.9,11.9,14.8,17.8,20.8,23.8,26.7,29.7], # 分割点
labels=[‘0-3’,‘3-5.9’,…] # 区间命名
right=True, # 区间默认是坐开右闭
precision=1)

用sns画图，可以直接汇总每个分段的数量后绘图，而不需要groupby汇总

相当于回到前面，用barplot绘图

sns.barplot(x=‘cut_point’,y=‘cnt’, data=data, estimator=np.sum, ci=0)
plt.xlabel(‘这是横坐标名称’)
plt.ylabel(‘这是纵坐标名称’)
plt.title(‘这是图标标题’)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
这里写图片描述

11.分面子图绘图
11.1
接下来好好说说这个比较难的，在10中我们分区间绘图，但是我们没有考虑platform这个因子变量啊，如果我们要考虑这个因子变量，就需要分面了，比如不同的platform画一个子图。

和上面的一样，先分组取出分割点

用pd.cut分段，并取出分段数值，通过 precision 控制小数的位数

data[‘bins’]=pd.cut(data[‘age’], bins=10,precision=1)

取出分割点，因为cut后得到的是 ‘(2.99, 5.97]’ 这样的字符串

data[‘cut_point’]=data[‘bins’].apply(lambda x: eval(x.replace(’]’,’)’))[1])

下面重点来了，用FacetGrid进行子图绘制

g=sns.FacetGrid(data=data,col=‘platform’,col_wrap=3,size=5) # 这里相当于groupby
g=g=g.map(sns.barplot,‘cut_point’,‘cnt’,ci=0, estimator=np.sum)

很奇怪的是，如果写

g=g.map(sns.barplot,x=‘cut_point’,y=‘cnt’,ci=0, estimator=np.sum)就报错。

1
2
3
4
5
6
7
8
9
10
11
12
这里写图片描述

11.2
自定义子图绘制

def my_barplot(x,y,**kwargs):
“”"
自定义函数的时候，没有显示传入dataframe，但是会自动获取，很神奇吧。
x,y是dataframe的列名
“”"
ax = plt.gca() # 这个是重点，获取对应的ax子图句柄
data[‘bins’]=pd.cut(data[‘age’], bins=10,precision=1)
data[‘cutpoint’]=data[‘bins’].apply(lambda x: eval(x.replace(’]’, ‘)’))[1])
sns.barplot(x=‘cutpoint’, y=‘cnt’,data=data, estimator=np.sum, ci=0, ax=ax)

g = sns.FacetGrid(data=data, col=‘platform’,col_wrap=3,
size=5,sharex=False)
g = g.map(my_barplot,‘age’,‘cnt’)
1
2
3
4
5
6
7
8
9
10
11
12
13
这里写图片描述

12.颜色主题
主题
在换了win10后发现seaborn的画出来的图很难看，基本上就是matplotlib的样子。想来肯定是主题和颜色样式没有设置好。今天看了下文档，补充下主题的设置。
seaborn的默认主题就是最好看的，如下：

import seaborn as sns
sns.set() # 恢复默认主题，在win10中开始的时候要执行一次。
1
2
还有其他几个主题，包括：

sns.set_style(“whitegrid”) # 白色网格背景
sns.set_style(“darkgrid”) # 灰色网格背景
sns.set_style(“dark”) # 灰色背景
sns.set_style(“white”) # 白色背景
sns.set_style(“ticks”) # 四周加边框和刻度
1
2
3
4
5
下面来几张图，发现就默认主题和白色网格背景是比较好看。
这里写图片描述
这里写图片描述
这里写图片描述

颜色
颜色一般来说用默认的颜色就好了，而且也比较好看，如果非要设置颜色，可以通过sns.set_palette(“husl”)设置。
常用的其他颜色模式还有：

sns.set_palette(“muted”) # 常用
sns.set_palette(“RdBu”)
sns.set_palette(“Blues_d”)
sns.set_palette(“Set1”)
sns.set_palette(“RdBu”)
1
2
3
4
5
效果如下图：
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

13.后话
这里只是简单说说seaborn常用的绘图函数而已，看seaborn官网上面有很多好看的图形样例，而这里的函数画出来的哪里有官网的好看啊。
而且这里也没有说到具体的布局控制，颜色主题等，要想绘制精美的图形，还需要学习具体的参数设定啊。

不过这里提到的这些简要图形，对于普通的分析快速绘图足够用了

你可能感兴趣的:(seaborn 常用画图)

Linux 内核数据结构解析--哈希链表 Black8Mamba24 Linux内核数据结构
一、Hash表的基本定义1.1Hash的概念散列表（Hashtable，也叫哈希表）,是一种数据结构，可以用于存储Key-Value键值对。也就是说，通过Key来映射到具体的Value。通常用于查找。将Key映射到Value的函数叫做Hash函数，而存储Key-Value的表叫做Hash表。Hasn表常用数组来存储。1.2常用的Hash函数1.3常用的处理碰撞的方法如果说存储空间是无线的，那只要定
RestTemplate和RPC区别酷爱码经验分享 rpc 网络协议网络
RestTemplate是Spring框架中用于进行RESTful风格的HTTP请求的模板类，通常用于与外部服务进行通信。它基于HTTP协议，使用GET、POST、PUT、DELETE等HTTP方法来进行通信，传输的数据通常使用JSON或XML格式。它是一种基于资源的通信方式，通过URL来标识资源。RPC（RemoteProcedureCall）是一种远程过程调用的通信机制，用于不同进程或不同主机
Milvus 中常见相似度度量方法 Sirius Wu milvus 机器学习算法
在Milvus中，相似度度量方法用于衡量向量之间的相似程度，不同的度量方法有不同的特点、优缺点和适用场景。以下是对Milvus中常见相似度度量方法的详细介绍以及对应的search参数示例。1.欧氏距离（L2Distance，L2）特点欧氏距离是最常用的距离度量方法之一，它计算的是两个向量在欧几里得空间中的直线距离。对于两个nnn维向量x⃗=(x1,x2,⋯ ,xn)\vec{x}=(x_1,x_2
45-JavaEE 开发中的动态代理与序列化技术只不过是胆小鬼罢了 WEB安全开发 java
在JavaEE开发领域，动态代理与序列化技术是两个关键知识点，它们在很多场景下发挥着重要作用。以下是对这两部分知识的深入探讨。动态代理代理模式概述代理模式是Java中常用的设计模式之一，其核心思想是代理类与委托类实现相同的接口。代理类的主要职责是为委托类进行预处理、消息过滤、转发消息以及事后处理等操作。这种模式在很多场景下都有应用，比如权限控制、日志记录、事务管理等。JDK动态代理实现步骤创建接口
Java 常用类Date 浅橙boy java 开发语言
这次介绍Java中常用类中的一种Date，一般常用的Date的包名为util即java.util.Date。还有一种Date类的包名为spl即java.spl.Date，这次不做介绍。包名为spl的Date类作用于和spl数据库打交道，其内容只包括日期，没有时间，包名为util的Date类作用于平常日期使用其内容包括日期和时间，且大部分的构造器和方法已经过时了，下面介绍的是平时还可以使用的方法和构
学习-Java常用类之Calendar类 AIains Educoder—Java java
第1关：学习-Java常用类之Calendar类任务描述相关知识编程要求测试说明任务描述本关任务：获取给定年月的最后一天。相关知识我们通过之前的学习已经能够格式化并创建一个日期对象了，但是我们如何才能设置和获取日期数据的特定部分呢，比如说小时，日，或者分钟?我们又如何在日期的这些部分加上或者减去值呢?calendar类是一个抽象类，是Java日期处理的核心类之一。Calendar类为操作日历字段，
Java基础回顾 Day5 小斌的Debug日记 Java基础回顾 java 开发语言
基础数据类型4类8种byte8位（常用流操作）short16位（运用场景不多）int32位（最常用）long64位（常用于表示时间毫秒）float32位（精度为7位，精度低）double64位（精度为15位，更常用）char16位（也可以算术运算）boolean8位（值为true或者false）基本数据类型的转换小转大为隐式转换，大转小为显式转换可能会丢失精度i++和++ii++是先取值在加1，而
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
基于Python PYQT5 的相机定时采集图像程序，GUI打包独立运行夏时summer time python qt 数码相机相机
基于PythonPYQT5编写相机定时采集图像及手动采集版本介绍Python3.6pyqt55.15.4pyqt5-tools5.15.4.3.2另外就是常用的cv2和numpy包fromPyQt5importQtCore,QtGui,QtWidgetsfromPyQt5importQtCore,QtGui,QtWidgetsimportcv2importnumpyasnpfromdatetime
CentOS7 安装Supervisor IChen. Linux 服务器运维
安装epel-releaseyum-yinstallepel-release安装supervisoryum-yinstallsupervisor开机自启systemctlenablesupervisord启动supervisord服务systemctlstartsupervisord重启supervisord服务systemctlrestartsupervisordSupervisor常用命令#重
股票量化交易开发 Yfinance 数字化转型2025 python 开发语言
以下是一段基于Python的股票量化分析代码，包含数据获取、技术指标计算、策略回测和可视化功能：pythonimportyfinanceasyfimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsfrombacktestingimportBacktest,Strategyfrombacktesti
sqlmap笔记君如尘网络安全-渗透笔记笔记
1.运行环境sqlmap是用Python编写的，因此首先需要确保你的系统上安装了Python。sqlmap支持Python2.6、2.7和Python3.4及以上版本。2.常用命令通用格式：bythonsqlmap.py-r注入点地址--参数-rpost请求-uget请求--level=测试等级--risk=测试风险-v显示详细信息级别-p针对某个注入点注入-threads更改线程数，加速--ba
JDK8新特性陈天在睡觉知识点总结 JavaSE java JDK8 javase 八股文后端
JDK8是官方发布的一个大版本,提供了很多新特性功能给开发者使用,包含语言、编译器、库、工具和JVM等方面的十多个新特性。本文将介绍编码过程中常用的一些新特性。一、Lambda表达式1.优点简化匿名内部类的写法，允许你以简洁的方式表示可传递给方法或存储在变量中的代码块，用更加简洁和表达性的语法来编写匿名函数，从而简化了对函数式接口的实现，使代码更加简洁紧凑。提高了代码的可读性和可维护性，尤其是在处
JavaScript基础-DOM的一些基本常用语法 Southern Wind JavaScript javascript
总结了一下JS一直到DOM中所用的单词的用法输入方式：window.prompt('请输入数据');输出方式：1、window.alert('HelloJavaScript');2、console.log输出到控制台3、输出数据到页面document.write('hello')JavaScript数据类型1、基本类型string：字符型number：数值型boolean：布尔型2、特殊类型und
【自建分布式数据库详细指南】（五）使用：常见API及使用问题大板牙花生分布式
延续前几篇文章，下面着重从一些基本的API讲讲从入门到习惯的常用方法，后续更新。USAGE1节点管理设置主节点，又成为协调节点SELECTcitus_set_coordinator_host('coord.example.com',5432);step1.创建节点select*frommaster_add_node('new-node',12345);step2.删除节点step3.新增节点后重新
《Oracle DBA入门实战：十大高频问题详解与避坑指南》鸿·蒙数据库 Oracle数据库 DBA入门数据库管理 IT技术干货学习笔记
OracleDBA入门作业十问十答本文为OracleDBA入门作业整理，涵盖工具使用、配置管理及权限控制等核心知识点，适合新手快速上手。如有疑问或补充，欢迎评论区交流！1.DBA常用工具有哪些？OracleUniversalInstaller(OUI)用途：安装、升级或删除软件组件。OracleDatabaseConfigurationAssistant(DBCA)用途：通过图形界面创建、删除或修
Android 中蓝牙Profile与UUID jaylkh android bluetooth
在Android中，常用的几种BluetoothProfile分别为：SPP(SerialPortProfile)、A2DP(AdvancedAudioDistributionProfile)、AVRCP(Audio/VideoRemoteControlProfile)、HID(HumanInterfaceDeviceProfile)、HFP(Hands-FreeProfile)。其中Media相
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
Google的BeyondCorp 零信任网络 yinhezhanshen 网络
Google的BeyondCorp是一种零信任安全框架1。简单来说，就是抛弃了传统的以网络边界为基础的安全防护模式，不再认为只要在企业内部网络里就都是安全的，而是把访问控制的重点放在每个用户和设备上。产生背景过去企业常用防火墙等构建安全边界，认为边界内是安全的，边界外有威胁。但随着网络发展，边界变得模糊，攻击技术演进，边界防护效果变差，内部也会出现安全问题。在这种情况下，Google提出了Beyo
epoll成员函数介绍 C嘎嘎嵌入式开发 Linux 服务器 c++开发语言
epoll_create1epoll_create1是Linux系统中用于创建一个新的epoll实例的系统调用。epoll是一种高效的I/O事件通知机制，常用于处理大量的文件描述符（如套接字）。epoll_create1是epoll_create的改进版本，提供了更多的灵活性。函数原型intepoll_create1(intflags);参数说明flags类型:int描述:用于指定创建epoll实
Python画词云图，Python画圆形词云图，API详解请一直在路上 python 开发语言
在Python中，词云图的常用库是wordcloud。以下是核心API参数的详细讲解，以及一个完整的使用示例。一、参数类型默认值说明参数类型默认值说明widthint400词云图的宽度（像素）heightint200词云图的高度（像素）background_colorstr“black”背景颜色，可以是颜色名称（如“white”）或十六进制值（如“#FFFFFF”）colormapstr/matp
23、nc文件快速切片与索引爱转呼啦圈的小兔子气象数据处理与可视化 python 气象气象可视化气候变化
1前言在气象、海洋学和环境科学等领域，.nc（NetCDF）格式文件是存储和共享多维科学数据的常用格式。这些数据文件通常包含大量的经度、纬度、时间和垂直层次数据。在处理这些数据时，研究人员常常需要根据特定的地理和时间范围提取数据，以便进行深入分析。为此，我们开发了一个名为nc_slice的Python函数，用于从一个或多个.nc格式文件中高效地筛选和提取数据。nc_slice函数提供了一种简洁而灵
Python读取nc文件的几种方式请一直在路上 python
在Python中，有多种方式可以读取NetCDF(.nc)文件。常见的方法包括使用以下库：1.netCDF4这是最常用的库之一，提供了直接读取、写入和处理NetCDF文件的功能。它支持版本3和版本4的NetCDF文件格式。安装：pipinstallnetCDF4用法：importnetCDF4asnc#打开文件dataset=nc.Dataset('example.nc')#查看文件的维度prin
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
Python 常用内建模块-HTMLParser 赔罪 Python 系统学习 python 开发语言
目录HTMLParser小结练习HTMLParser如果我们要编写一个搜索引擎，第一步是用爬虫把目标网站的页面抓下来，第二步就是解析该HTML页面，看看里面的内容到底是新闻、图片还是视频。假设第一步已经完成了，第二步应该如何解析HTML呢？HTML本质上是XML的子集，但是HTML的语法没有XML那么严格，所以不能用标准的DOM或SAX来解析HTML。好在Python提供了HTMLParser来非
Python 常用内建模块-venv 赔罪 Python 系统学习 python 开发语言
目录venv小结venv在开发Python应用程序的时候，系统安装的Python3只有一个版本：3.x。所有第三方的包都会被pip安装到Python3的site-packages目录下。如果我们要同时开发多个应用程序，那这些应用程序都会共用一个Python，就是安装在系统的Python3。如果应用A需要jinja2.7，而应用B需要jinja2.6怎么办？这种情况下，每个应用可能需要各自拥有一套“
MATLAB数据的保存与读取晚风微凉～ java 前端 javascript
在工程应用中，我们经常需要将未处理完的数据保存起来以便后期使用，或者在一些复杂计算中，我们需要多次计算过程中，由于系统的工作空间会随着系统的关闭而被释放掉，导致下次使用时无法快速调用，所有需要对数据进行保存与读取。1.核心代码1）数据保存基于MATALB的储存数据的常用命令是"save",使用save会将数据以二进制的方式存储在后缀名）为"文件名字.mat";savedemo01使用该命令会将数据
nvm管理多版本node,nvm 配置国内镜像，npm配置国内镜像奇纳尼 npm 前端 node.js
目录前言nvm是什么？安装nvm配置nvm国内镜像nvm常用命令npm配置国内镜像：淘宝镜像nrm源管理命令：可以不用实际项目中会遇到的问题前言公司多个项目需要配置不同版本的node,按照传统方式一直切换下载安装不同版本的node太麻烦了，发现nvm可以管理多版本nodenvm是什么？nvm（node.jsversionmanagement），是一个nodejs的版本管理工具。nvm和n都是nod
实时光线追踪技术：Ray Tracing_2024-07-21_02-55-16.Tex chenjj4003 游戏开发 python 算法人工智能矩阵线性代数骨骼绑定开发语言
实时光线追踪技术：RayTracing实时光线追踪技术教程基础知识光线追踪原理光线追踪是一种渲染技术，它通过模拟光线在场景中的传播和反射来生成图像。在实时光线追踪中，这一过程被优化以在有限的时间内完成，通常用于游戏和实时动画。其核心原理是逆向追踪，即从观察者（摄像机）发出光线，而不是从光源发出，这样可以减少计算量。示例：光线追踪的基本算法#Python示例代码，展示如何计算光线与场景中物体的交点c
图像质量评价学习笔记02：IQA模型性能评价指标（PLCC、SROCC、KROCC、RMSE）可靠的豆包蟹同志图像质量评估IQA 图像处理计算机视觉人工智能算法
性能好的图像质量评价（IQA）算法，其质量评测分数会与主观质量分数高度一致，IQA有许多评价指标，为了衡量方法测试结果与主观评价之间的一致性，视频质量专家组VQEG（VideoQualityExpertsGroup，目前国际上对视频质量进行标准化及性能测试的权威组织）提出了四个可以验证客观评价结果和主观评价结果之间的紧密程度的四个指标：PLCC、SROCC、KROCC和RMSE，也是目前最常用的I
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

seaborn 常用画图

绘制箱线图

竖着放的箱线图，也就是将x换成y

分组绘制箱线图，分组因子是day，在x轴不同位置绘制

分组箱线图，分子因子是smoker，不同的因子用不同颜色区分

相当于分组之后又分组

改变线宽，linewidth参数

改变x轴顺序，order参数

对dataframe的每个变量都绘制一个箱线图，水平放置

箱线图+有分布趋势的散点图

图形组合也就是两条绘图语句一起运行就可以了，相当于图形覆盖了

绘制小提琴图

分组的小提琴图，同上面的箱线图一样通过X轴分组

通过hue分组的小提琴图，相当于分组之后又分组

分组组合的小提琴图，其实就是hue分组后，各取一半组成一个小提琴图

调整x轴顺序，同样通过order参数

普通的散点图

带分布密度的散点图

分组的散点图

添加抖动项的散点图，jitter可以是0.1,0.2…这样的小数，表示抖动的程度大小

是不是想横着放呢，很简单的，x-y顺序换一下就好了

重点来了，分组绘制，而且是分组后分开绘制，在柱状图中，跟分组柱状图类似的。

通过 hue, split 参数控制

1.分组

2.分开绘制

散点图+小提起图

两条命令一起运行就行了

分组的散点图

箱线图+散点图

whis 参数设定是否显示箱线图的离群点，whis=np.inf 表示不显示

小提琴图+散点图

注意看看Y轴，看到没，统计函数默认是 mean，

分组的柱状图

绘制变量中位数的直方图，estimator指定统计函数

改变主题颜色

palette=“Blues_d”

分组绘图

如果是横着放，x用y替代

用小提琴图 反应 time-pulse 两变量的分布情形

不同的deck（因子）绘制不同的alive（数值），col为分子图绘制，col_wrap每行画4个子图

线性回归图

分组的线性回归图，通过hue参数控制

分组绘图，不同的组用不同的形状标记

不仅分组，还分开不同的子图绘制，用col参数控制

col+hue 双分组参数，既分组，又分子图绘制，jitter控制散点抖动程度

分组绘制，控制size尺寸

既然col可以控制分组子图的，那么row也是可以控制分组子图的

控制散点的形状和颜色

控制回归的置信度，你会看到拟合直线的外面的面积的有变化的

上面的都是拟合一次曲线，拟合二次曲线通过order=2设置，

拟合一次曲线相当于 order=1

绘制数值变量的密度分布图

默认既绘制核密度曲线，也绘制直方图

只绘制核密度曲线，不绘制直返图

横着放

绘制核密度图

shade参数决定是否填充曲线下面积

双变量密度图，相当于等高线图了

shade 参数改用颜色深浅表示密度的大小，不过不用，就真的是等高线了

分组绘制双变量的核密度图

相当于绘制两个核密度图，通过图可以看到密度中心

类似于挖掘算法中聚类中心绘图

默认绘制双变量的散点图，计算两个变量的直方图，计算两个变量的相关系数和置信度

通过kind参数，除了绘制散点图，还要绘制拟合的直线，拟合的核密度图

使用六角形代替点图图

绘制核密度图

控制图形的大小和颜色

x-y 的散点图，不画回归线，fit_reg=False

只画回归线，不画散点图，scatter=False

分组的变量关系图，似乎很厉害啊

hue 分组后，不同的组用不同的形状标记

当然也可以只取dataframe中的一部分变量绘图

对角线默认绘制直方图，当然也可以绘制核密度图

相应的，两变量关系图，也可以绘制线性回归图

改变颜色映射的值范围

绘制x-y-z的热力图，比如 年-月-销量 的热力图

绘制热力图，还要将数值写到热力图上

这个图在绘制缺失值分布有用，但是不知道怎么样。

Plot every other column label and don’t plot row labels

Plot a trace with translucent confidence bands:

用小提琴图反应 time-pulse 两变量的分布情形

绘制x-y-z的热力图，比如年-月-销量的热力图