Dean0Winchester

Python笔记——python seaborn画图

python seaborn画图

以前觉得用markdown写图文混排的文字应该很麻烦，后来发现CSDN的markdown真是好用的。

在做分析时候，有时需要画几个图看看数据分布情况，但总记不住python的绘图函数。今天有空顺便整理下python的seaborn绘图函数库。
Seaborn其实是在matplotlib的基础上进行了更高级的API封装，从而使得作图更加容易，在大多数情况下使用seaborn就能做出很具有吸引力的图，而使用matplotlib能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充，而不是替代物。

seaborns是针对统计绘图的，方便啊。

一般来说，seaborn能满足数据分析90%的绘图需求，够用了，如果需要复杂的自定义图形，还是要matplotlit。这里也只是对seaborn官网的绘图API简单翻译整理下，对很多参数使用方法都没有说到，如果需要精细绘图，还是需要参照其seaborn的文档的。

这里简要介绍常用的图形，常用的参数，其精美程度不足以当做报告绘图，算是做笔记吧。

1.几个概念

如果使用过R语言的ggplot2绘图包，对分组分面，统计绘图等概念应该很熟悉，这里也介绍下。

1.1.分组绘图

比如说需要在一张图上绘制两条曲线，分别是南方和北方的气温变化，分别用不同的颜色加以区分。在seaborn中用hue参数控制分组绘图。

1.2.分面绘图

其实就是在一张纸上划分不同的区域，比如2*2的子区域，在不同的子区域上绘制不同的图形，在matplotlib中就是 add_subplot(2,2,1)，在seaborn中用col参数控制，col的全称是columns，不是color，如果辅助col_wrap参数会更好些。后来发现，col可以控制columns的子图，那么row可以控制rows的子图排列。
如果需要分面绘图，应该使用seaborn的FacetGrid对象，seaborn的一般的绘图函数是没有分面这个参数的。

1.3.统计函数

分组绘图的时候，会对分组变量先要用统计函数，然后绘图，比如先计算变量的均值，然后绘制该均值的直方图。统计绘图参数是 estimator，很多情况下默认是numpy.mean。在ggplot2中就大量使用了这种方法。如果不适用统计绘图，就需要先用pandas进行groupby分组汇总，然后用seaborn绘图，多此一举了。

2.图形分类

在seaborn中图形大概分这么几类，因子变量绘图，数值变量绘图，两变量关系绘图，时间序列图，热力图，分面绘图等。

因子变量绘图

箱线图boxplot
小提琴图violinplot
散点图striplot
带分布的散点图swarmplot
直方图barplot
计数的直方图countplot
两变量关系图factorplot

回归图
回归图只要探讨两连续数值变量的变化趋势情况，绘制x-y的散点图和回归曲线。

线性回归图lmplot
线性回归图regplot

分布图
包括单变量核密度曲线，直方图，双变量多变量的联合直方图，和密度图

热力图
1. 热力图heatmap

聚类图
1. 聚类图clustermap

时间序列图
1. 时间序列图tsplot
2. 我的时序图plot_ts_d , plot_ts_m

分面绘图
1.分面绘图FacetGrid

3.因子变量绘图

3.1.boxplot箱线图

import seaborn as sns
sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
# 绘制箱线图
ax = sns.boxplot(x=tips["total_bill"])
# 竖着放的箱线图，也就是将x换成y
ax = sns.boxplot(y=tips["total_bill"])
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7

# 分组绘制箱线图，分组因子是day，在x轴不同位置绘制
ax = sns.boxplot(x="day", y="total_bill", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 分组箱线图，分子因子是smoker，不同的因子用不同颜色区分
# 相当于分组之后又分组
ax = sns.boxplot(x="day", y="total_bill", hue="smoker",
                    data=tips, palette="Set3")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 改变线宽，linewidth参数
ax = sns.boxplot(x="day", y="total_bill", hue="time",
                    data=tips, linewidth=2.5)

# 改变x轴顺序，order参数
ax = sns.boxplot(x="time", y="tip", data=tips,
                    order=["Dinner", "Lunch"])
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7

# 对dataframe的每个变量都绘制一个箱线图，水平放置
iris = sns.load_dataset("iris")
ax = sns.boxplot(data=iris, orient="h", palette="Set2")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

箱线图+有分布趋势的散点图–>的组合图

# 箱线图+有分布趋势的散点图
# 图形组合也就是两条绘图语句一起运行就可以了，相当于图形覆盖了
ax = sns.boxplot(x="day", y="total_bill", data=tips)
ax = sns.swarmplot(x="day", y="total_bill", data=tips, color=".25")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

3.2.violinplot小提琴图

小提琴图其实是箱线图与核密度图的结合，箱线图展示了分位数的位置，小提琴图则展示了任意位置的密度，通过小提琴图可以知道哪些位置的密度较高。在图中，白点是中位数，黑色盒型的范围是下四分位点到上四分位点，细黑线表示须。外部形状即为核密度估计（在概率论中用来估计未知的密度函数，属于非参数检验方法之一）。

import seaborn as sns
sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
# 绘制小提琴图
ax = sns.violinplot(x=tips["total_bill"])
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

# 分组的小提琴图，同上面的箱线图一样通过X轴分组
ax = sns.violinplot(x="day", y="total_bill", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 通过hue分组的小提琴图，相当于分组之后又分组
ax = sns.violinplot(x="day", y="total_bill", hue="smoker",
                        data=tips, palette="muted")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

# 分组组合的小提琴图，其实就是hue分组后，各取一半组成一个小提琴图
ax = sns.violinplot(x="day", y="total_bill", hue="smoker",
                        data=tips, palette="muted", split=True)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

# 调整x轴顺序，同样通过order参数
ax = sns.violinplot(x="time", y="tip", data=tips,
                    order=["Dinner", "Lunch"])
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

其他的样式不常用，就不贴上来了。

3.3.stripplot散点图

需要注意的是，seaborn中有两个散点图，一个是普通的散点图，另一个是可以看出分布密度的散点图。下面把它们花在一起就明白了。

# 普通的散点图
ax1 = sns.stripplot(x=tips["total_bill"])
# 带分布密度的散点图
ax2 = sns.swarmplot(x=tips["total_bill"])
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 分组的散点图
ax = sns.stripplot(x="day", y="total_bill", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 添加抖动项的散点图，jitter可以是0.1,0.2...这样的小数，表示抖动的程度大小
ax = sns.stripplot(x="day", y="total_bill", data=tips, jitter=True)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 是不是想横着放呢，很简单的，x-y顺序换一下就好了
ax = sns.stripplot(x="total_bill", y="day", data=tips,jitter=True)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 重点来了，分组绘制，而且是分组后分开绘制，在柱状图中，跟分组柱状图类似的。
# 通过 hue, split 参数控制
# 1.分组
ax = sns.stripplot(x="sex", y="total_bill", hue="day",
                    data=tips, jitter=True)
# 2.分开绘制
ax = sns.stripplot(x="day", y="total_bill", hue="smoker",
                data=tips, jitter=True,palette="Set2", split=True)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8

# 散点图+小提起图
# 两条命令一起运行就行了
ax = sns.violinplot(x="day", y="total_bill", data=tips,inner=None, color=".8")
ax = sns.stripplot(x="day", y="total_bill", data=tips,jitter=True)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

3.4.swarmplot带分布的散点图

swarmplt的参数和用法和stripplot的用法是一样的，只是表现形式不一样而已。

import seaborn as sns
sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
ax = sns.swarmplot(x=tips["total_bill"])
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 分组的散点图
ax = sns.swarmplot(x="day", y="total_bill", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 箱线图+散点图
# whis 参数设定是否显示箱线图的离群点，whis=np.inf 表示不显示
ax = sns.boxplot(x="tip", y="day", data=tips, whis=np.inf)
ax = sns.swarmplot(x="tip", y="day", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 小提琴图+散点图
ax = sns.violinplot(x="day", y="total_bill", data=tips, inner=None)
ax = sns.swarmplot(x="day", y="total_bill", data=tips,
                    color="white", edgecolor="gray")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

3.5.pointplot

Show point estimates and confidence intervals using scatter plot glyphs.
使用散点图符号显示点估计和置信区间。

这个我不知道在什么地方用到，不太明白。就先写这个了。

3.6.barplot直方图

我不喜欢显示直方图上面的置信度线，难看，所以下面的图形我都设置ci=0.(Size of confidence intervals to draw around estimated values)

直方图的统计函数，绘制的是变量的均值 estimator=np.mean

# 注意看看Y轴，看到没，统计函数默认是 mean，
import seaborn as sns
sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
ax = sns.barplot(x="day", y="total_bill", data=tips,ci=0)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

# 分组的柱状图
ax = sns.barplot(x="day", y="total_bill", hue="sex", data=tips,ci=0)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 绘制变量中位数的直方图，estimator指定统计函数
from numpy import median
ax = sns.barplot(x="day", y="tip", data=tips, 
                    estimator=median, ci=0)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 改变主题颜色
# palette="Blues_d"
ax = sns.barplot("size", y="total_bill", data=tips, 
                    palette="Blues_d")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

3.7.countplot计数统计图

这个很重要，对因子变量计数，然后绘制条形图

import seaborn as sns
sns.set(style="darkgrid")
titanic = sns.load_dataset("titanic")
ax = sns.countplot(x="class", data=titanic)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 分组绘图
ax = sns.countplot(x="class", hue="who", data=titanic)

# 如果是横着放，x用y替代
ax = sns.countplot(y="class", hue="who", data=titanic)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

3.8.factorplot

这是一类重要的变量联合绘图。
绘制因子变量-数值变量的分布情况图。

# 用小提琴图 反应 time-pulse 两变量的分布情形
import seaborn as sns
sns.set(style="ticks")
exercise = sns.load_dataset("exercise")
g = sns.factorplot(x="time", y="pulse", hue="kind",
                    data=exercise, kind="violin")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

# 不同的deck（因子）绘制不同的alive（数值），col为分子图绘制，col_wrap每行画4个子图
titanic = sns.load_dataset("titanic")
g = sns.factorplot(x="alive", col="deck", col_wrap=4,
                    data=titanic[titanic.deck.notnull()],
                    kind="count", size=2.5, aspect=.8)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

4.回归图

回归图有两个，我暂时没有看出他们有什么区别，从函数说明来看看吧。
lmplot： Plot data and regression model fits across a FacetGrid.
regplot：Plot data and a linear regression model fit.

4.1.回归图lmplot

# 线性回归图
import seaborn as sns; sns.set(color_codes=True)
tips = sns.load_dataset("tips")
g = sns.lmplot(x="total_bill", y="tip", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 分组的线性回归图，通过hue参数控制
g = sns.lmplot(x="total_bill", y="tip", hue="smoker", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 分组绘图，不同的组用不同的形状标记
g = sns.lmplot(x="total_bill", y="tip", hue="smoker", 
                data=tips,markers=["o", "x"])
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

# 不仅分组，还分开不同的子图绘制，用col参数控制
g = sns.lmplot(x="total_bill", y="tip", col="smoker", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2

# col+hue 双分组参数，既分组，又分子图绘制，jitter控制散点抖动程度
g = sns.lmplot(x="size", y="total_bill", hue="day", 
                col="day",data=tips, aspect=.4, x_jitter=.1)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

# 分组绘制，控制size尺寸
g = sns.lmplot(x="total_bill", y="tip", col="day", hue="day",
                data=tips, col_wrap=2, size=3)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

# 既然col可以控制分组子图的，那么row也是可以控制分组子图的
g = sns.lmplot(x="total_bill", y="tip", row="sex", 
                col="time", data=tips, size=3)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

4.2.回归图regplot

Plot the relationship between two variables in a DataFrame:

import seaborn as sns; sns.set(color_codes=True)
tips = sns.load_dataset("tips")
ax = sns.regplot(x="total_bill", y="tip", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

# 控制散点的形状和颜色
import numpy as np; np.random.seed(8)
mean, cov = [4, 6], [(1.5, .7), (.7, 1)]
x, y = np.random.multivariate_normal(mean, cov, 80).T
ax = sns.regplot(x=x, y=y, color="g", marker="+")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

# 控制回归的置信度，你会看到拟合直线的外面的面积的有变化的
ax = sns.regplot(x=x, y=y, ci=68)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 上面的都是拟合一次曲线，拟合二次曲线通过order=2设置，
# 拟合一次曲线相当于 order=1
ans = sns.load_dataset("anscombe")
ax = sns.regplot(x="x", y="y", data=ans.loc[ans.dataset == "II"],
                scatter_kws={"s": 80},order=2, ci=None, truncate=True)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

5.数值分布绘图

5.1.直方图histplot

直方图hist=True，核密度曲线rug=True

# 绘制数值变量的密度分布图
# 默认既绘制核密度曲线，也绘制直方图
import seaborn as sns, numpy as np
sns.set(rc={"figure.figsize": (8, 4)}); np.random.seed(0)
x = np.random.randn(100)
ax = sns.distplot(x)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

# 只绘制核密度曲线，不绘制直返图
ax = sns.distplot(x, rug=True, hist=False)
   
   
   
   
    
    
    
    1
    
    
    
    2

# 横着放
ax = sns.distplot(x, vertical=True)
   
   
   
   
    
    
    
    1
    
    
    
    2

5.2.核密度图kdeplot

# 绘制核密度图
import numpy as np; np.random.seed(10)
import seaborn as sns; sns.set(color_codes=True)
mean, cov = [0, 2], [(1, .5), (.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, size=50).T
ax = sns.kdeplot(x)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

# shade参数决定是否填充曲线下面积
ax = sns.kdeplot(x, shade=True, color="r")
   
   
   
   
    
    
    
    1
    
    
    
    2

# 双变量密度图，相当于等高线图了
# shade 参数改用颜色深浅表示密度的大小，不过不用，就真的是等高线了
ax = sns.kdeplot(x, y, shade=True)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

# 分组绘制双变量的核密度图
# 相当于绘制两个核密度图，通过图可以看到密度中心
# 类似于挖掘算法中聚类中心绘图
iris = sns.load_dataset("iris")
setosa = iris.loc[iris.species == "setosa"]  # 组1
virginica = iris.loc[iris.species == "virginica"]  # 组2

ax = sns.kdeplot(setosa.sepal_width, setosa.sepal_length, 
                    cmap="Reds", shade=True, shade_lowest=False)

ax = sns.kdeplot(virginica.sepal_width, virginica.sepal_length, 
                    cmap="Blues", shade=True, shade_lowest=False)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12

5.3.双变量关系图jointplot

joint，顾名思义，就是联合呀。
Draw a plot of two variables with bivariate and univariate graphs.

kind参数可以使用不同的图形反应两变量的关系，比如点图，线图，核密度图。

# 默认绘制双变量的散点图，计算两个变量的直方图，计算两个变量的相关系数和置信度
import numpy as np, pandas as pd; np.random.seed(0)
import seaborn as sns; sns.set(style="white", color_codes=True)
tips = sns.load_dataset("tips")
g = sns.jointplot(x="total_bill", y="tip", data=tips)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

# 通过kind参数，除了绘制散点图，还要绘制拟合的直线，拟合的核密度图
 g = sns.jointplot("total_bill", "tip", data=tips, kind="reg")
   
   
   
   
    
    
    
    1
    
    
    
    2

# 使用六角形代替点图图
g = sns.jointplot("total_bill", "tip", data=tips, kind="hex")
   
   
   
   
    
    
    
    1
    
    
    
    2

# 绘制核密度图
iris = sns.load_dataset("iris")
g = sns.jointplot("sepal_width", "petal_length", data=iris, 
                    kind="kde", space=0, color="g")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 控制图形的大小和颜色
g = sns.jointplot("total_bill", "tip", data=tips, 
                    size=5, ratio=3, color="g")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

5.4.变量关系组图pairplot

就是绘制dataframe中各个变量两两之间的关系图。
在变量关系图中，最常见的就是 x-y的线图，x-y的散点图，x-y的回归图。其实这三者都可以通过lmplot绘制，只是控制不同的参数而已。x-y的线图，其实就是时间序列图，这里就不说了。
这里又说一遍散点图，是为了和前面的因子变量散点图相区分，前面的因子变量散点图，讲的是不同因子水平的值绘制的散点图，而这里是两个数值变量值散点图关系。为什么要用lmplot呢，说白了就是，先将这些散点画出来，然后在根据散点的分布情况拟合出一条直线。但是用lmplot总觉得不好，没有用scatter来得合适。

# x-y 的散点图，不画回归线，fit_reg=False

tips = sns.load_dataset("tips")
g = sns.lmplot(x="total_bill", y="tip", data=tips,
                fit_reg=False,hue='smoker',scatter=True)

# 只画回归线，不画散点图，scatter=False
g = sns.lmplot(x="total_bill", y="tip", data=tips,
                fit_reg=True,hue='smoker',scatter=False)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9

import seaborn as sns; sns.set(style="ticks", color_codes=True)
iris = sns.load_dataset("iris")
g = sns.pairplot(iris)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

# 分组的变量关系图，似乎很厉害啊
g = sns.pairplot(iris, hue="species")
   
   
   
   
    
    
    
    1
    
    
    
    2

# hue 分组后，不同的组用不同的形状标记
g = sns.pairplot(iris, hue="species", markers=["o", "s", "D"])
   
   
   
   
    
    
    
    1
    
    
    
    2

# 当然也可以只取dataframe中的一部分变量绘图
g = sns.pairplot(iris, vars=["sepal_width", "sepal_length"])
   
   
   
   
    
    
    
    1
    
    
    
    2

# 对角线默认绘制直方图，当然也可以绘制核密度图
g = sns.pairplot(iris, diag_kind="kde")
# 相应的，两变量关系图，也可以绘制线性回归图
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

6.热力图

6.1.热力图heatmap

import numpy as np; np.random.seed(0)
import seaborn as sns; sns.set()
uniform_data = np.random.rand(10, 12)
ax = sns.heatmap(uniform_data)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 改变颜色映射的值范围
ax = sns.heatmap(uniform_data, vmin=0, vmax=1)
   
   
   
   
    
    
    
    1
    
    
    
    2

Plot a dataframe with meaningful row and column labels:
# 绘制x-y-z的热力图，比如 年-月-销量 的热力图
flights = sns.load_dataset("flights")
flights = flights.pivot("month", "year", "passengers")
ax = sns.heatmap(flights)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

# 绘制热力图，还要将数值写到热力图上
ax = sns.heatmap(flights, annot=True, fmt="d")
   
   
   
   
    
    
    
    1
    
    
    
    2

# 这个图在绘制缺失值分布有用，但是不知道怎么样。
# Plot every other column label and don’t plot row labels 
data = np.random.randn(50, 20)
ax = sns.heatmap(data, xticklabels=2, yticklabels=False)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

7.聚类图clustermap

暂时不知道怎么用，先这样吧。

8.时间序列图

tsplot函数说是绘制时间序列图，还不如说是绘制简单的线图更加合适吧，因为我在绘制带timestap时间索引的pandas.Series时，并没有自动升采样绘图，只是数据有有什么数据就画什么，这在时间序列上应该是不对的。

因为我遇到这样一种情况，一个产品只在上半年卖，从数据库中取出数据只有每年上半年的数据，下半年没有数据也应该填充为0才对啊，但是seaborn的tsplot没有这个功能。

下面先介绍tsplot绘制线图吧，传入一个list或者series，直接绘制线图。

8.1.tsplot时序图

# Plot a trace with translucent confidence bands:
# 绘制带有半透明置信带的轨迹：
# data是多组list的组合，这时候应该绘制多条曲线才对啊，其实不是的，是多组list的均值的序列图（默认）
import numpy as np; np.random.seed(22)
import seaborn as sns; sns.set(color_codes=True)
x = np.linspace(0, 15, 31)
data = np.sin(x) + np.random.rand(10, 31) + np.random.randn(10, 1)
ax = sns.tsplot(data=data)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8

# tsplot的参数不太懂，直接上图吧
gammas = sns.load_dataset("gammas")
ax = sns.tsplot(time="timepoint", value="BOLD signal", 
                unit="subject", condition="ROI", data=gammas)
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

# 绘制不同的置信度拟合图，这个好用
ax = sns.tsplot(data=data, ci=[68, 95], color="m")
   
   
   
   
    
    
    
    1
    
    
    
    2

# 使用不同的统计函数，默认的是均值，这里是中位数
ax = sns.tsplot(data=data, estimator=np.median)
   
   
   
   
    
    
    
    1
    
    
    
    2

8.2.panda线图

pandas的dataframe本身也有绘图函数，对于常见的分析图形还是很方便的，而且可以在plot函数中指定title等

sale4.loc[sale4['sku']=='SKU412946',['month','salecount']]\
     .plot(x='month',y='salecount',title='SKU412946')
   
   
   
   
    
    
    
    1
    
    
    
    2

8.3.采样的时序图

这里重点讲一下。如果时序中每天的数据都有还好说，如果没有，就需要采样了。

def plot_ts_day(x,y):
    """绘制每天的时间序列图。
    需要注意的是，序列是不是连续的，也就是说某天的数据是没有的,因此需要采样至每天都有记录，原来数据没有的就填充0
    x:时间轴，string或者time类型,是一个seires
    y:值
    """
    # x转成时间类型Timestamp，y也转成list
    x=[pd.to_datetime(str(i)) for i in x]
    y=[i for i in y]
    s=pd.Series(y,index=x)
    s = s.resample(rule='D',fill_method='ffill') # 生采样没有的会被填充
    # 原来没有的就填充为0
    s[s.index]=0
    s[x]=y
    # 重建索引，画出来的图好看点
    x2 = [i.strftime('%Y-%m-%d') for i in s.index]
    s.index = x2
    # 画图，这里使用series的plot函数，而不是seaborn.tsplot函数
    s.plot()
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14
    
    
    
    15
    
    
    
    16
    
    
    
    17
    
    
    
    18
    
    
    
    19

def plot_ts_month(x,y):
    """绘制月的时间序列图，每月一个数据点，而不是每天一个"""
    # 将x转成时间类型timestamp,y也转成list
    try:
        x = [pd.to_datetime(str(i)) for i in x]
    except:
        x=[pd.to_datetime(str(i)+'01') for i in x]
    y=[i for i in y]
    #
    s=pd.Series(y,index=x)
    # 降采样至月
    s = s.resample('M', label='right').sum().fillna(0)
    # 重建索引，这样画出来的图好看点
    s.index=[i.strftime('%Y%m') for i in s.index]
    s.plot()
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14
    
    
    
    15

8.4.pandas分组的线图

说实话，到现在还没搞懂怎么用sns.tsplot绘制分组线图，但是任务紧急，就用pandas的dataframe自带方法plot来绘图了，其实也挺简单的。
主要注意的是，尽量给dataframe或者series建立时间索引，不然x轴很难看的。

# 绘制月销量图
# 数据如下
# year  month2  salecount
# 2014       1        531
# 2014       2        505

# 建立索引，'201601'
data.index = data['year'].map(str)+data['month2'].map(lambda x: str(x) if x>=10 else '0'+str(x))
# 绘图，其实也就是和8.3的方法一致了
data['salecount'].plot()
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10

分组的线图，比如seaborn中的hue参数，方法是，先将dataframe长表格式转成宽表格式（透视表），每列是不同的年。

# 分组的线图
# 转成透视表后，绘图
data.pivot(index='month2',columns='year',values='salecount').plot(title='销量')

# 当数据很大的时候，你想绘制分组的统计图，比如将不同产品，相同的年月的销量进行加或者均值后在绘制线图
# 使用 aggfunc 参数即可，默认是mean
data.pivot_table(index='month2',columns='year',values='salecount',aggfunc='sum') \
    .plot(title='销量',style='o-')
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8

图形格式选项

# 图形参数
# style
# 图形的属性
# 1.color:颜色
# 1.1 r：红色
# 1.2 b：蓝色
# 1.3 g：绿色
# 1.3 y：黄色
#
# 2.数据标记markder
# 2.1 o：圆圈
# 2.2 .：圆点
# 2.2 d：棱形
#
# 3.线型linestyle
# 3.1 没有参数的话就是默认画点图
# 3.2 --：虚线
# 3.3 -：实线
#
# 4.透明度
# alpha
#
# 5.大小
# size
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14
    
    
    
    15
    
    
    
    16
    
    
    
    17
    
    
    
    18
    
    
    
    19
    
    
    
    20
    
    
    
    21
    
    
    
    22
    
    
    
    23
    
    
    
    24

# 绘 "点-线" 图
data.pivot(index='month2',columns='year',values='salecount')\
    .plot(title='销量',style='-o')
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

9.双坐标轴图

有没有遇到这样一种情况，需要将销量和趋势图和温度的变化图同时画在一幅图上，以便观察两者的趋势变化情况，但是因两者是数值差距很大，如果共用同一Y轴，温度曲线就基本看不到了。还是上图上代码吧。

import seaborn as sns
sale=pd.Series(np.random.random(10)*100).map(int)
tmperature=pd.Series(np.random.random(10)*10).map(int)

ax=plt.subplot(111)
sale.plot(ax=ax,color='b')
ax.set_xlabel('time')
ax.set_ylabel('sale')

# 重点来了，twinx 或者 twiny 函数
ax2 = ax.twinx()
tmperature.plot(ax=ax2,color='r')
ax2.set_ylabel('tmperature')
plt.title('double series figure')
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14

9.一些技巧

9.1 批量保存图片

如果只有一张图片，这没什么好说的，但是如果要对每个维度绘图，然后保存图片呢。

fig = plt.figure()
ax=fig.add_subplot(111)
sub_data[years].plot(ax=ax, style='o-',title='%s 月销量趋势图'%lev3)
file = r'E:\服装预测\销量趋势-%s.jpg' %lev3
savefig(file)
time.sleep(0.5)  # 注意这里要暂停一下，不然会出问题的
plt.close()   # 最后记得关闭句柄
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7

9.2 显示中文问题

import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib.pyplot import savefig

mpl.rcParams['font.sans-serif'] = ['SimHei']  # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题

   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8

10.分段统计绘图

遇到这样一种情况，如下的数据格式，现在platform不是重点，需要对diff_date字段分段汇总然后绘图。

# platform  age         cnt
# 2         0           22
# 2         0           40
# 4         0.1         47
# 5         0.1         48
# 3         0.1         51
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

这里借用panas.cut函数，因为是绘图看趋势，不需要精确得到每个分段的分割点。

cut函数有两种使用方法，如果bins=10这样的数值，则将series切成等间隔的10段，如果bins=[0,5,20,55...]这样的一个列表，则根据列表规则切分。

# 先用pd.cut分段，并取出分段数值
# 通过 precision 控制小数的位数
data['cut_point']=pd.cut(data['age'], 
    bins=[0,3,5.9,8.9,11.9,14.8,17.8,20.8,23.8,26.7,29.7],  # 分割点
    labels=['0-3','3-5.9',......]    # 区间命名
    right=True,    # 区间默认是坐开右闭
    precision=1)

# 用sns画图，可以直接汇总每个分段的数量后绘图，而不需要groupby汇总
# 相当于回到前面，用barplot绘图
sns.barplot(x='cut_point',y='cnt', data=data, estimator=np.sum, ci=0)
plt.xlabel('这是横坐标名称')
plt.ylabel('这是纵坐标名称')
plt.title('这是图标标题')
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14

11.分面子图绘图

11.1

接下来好好说说这个比较难的，在10中我们分区间绘图，但是我们没有考虑platform这个因子变量啊，如果我们要考虑这个因子变量，就需要分面了，比如不同的platform画一个子图。

# 和上面的一样，先分组取出分割点

# 用pd.cut分段，并取出分段数值，通过 precision 控制小数的位数
data['bins']=pd.cut(data['age'], bins=10,precision=1)
# 取出分割点，因为cut后得到的是 '(2.99, 5.97]' 这样的字符串
data['cut_point']=data['bins'].apply(lambda x: eval(x.replace(']',')'))[1])

# 下面重点来了，用FacetGrid进行子图绘制
g=sns.FacetGrid(data=data,col='platform',col_wrap=3,size=5)   # 这里相当于groupby
g=g=g.map(sns.barplot,'cut_point','cnt',ci=0, estimator=np.sum)
# 很奇怪的是，如果写 
# g=g.map(sns.barplot,x='cut_point',y='cnt',ci=0, estimator=np.sum)就报错。
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12

11.2

自定义子图绘制

def my_barplot(x,y,**kwargs):
    """
    自定义函数的时候，没有显示传入dataframe，但是会自动获取，很神奇吧。
    x,y是dataframe的列名
    """
    ax = plt.gca()  # 这个是重点，获取对应的ax子图句柄
    data['bins']=pd.cut(data['age'], bins=10,precision=1)
    data['cutpoint']=data['bins'].apply(lambda x: eval(x.replace(']', ')'))[1])
    sns.barplot(x='cutpoint', y='cnt',data=data, estimator=np.sum, ci=0, ax=ax)

g = sns.FacetGrid(data=data, col='platform',col_wrap=3,
                    size=5,sharex=False)
g = g.map(my_barplot,'age','cnt')
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13

12.颜色主题

主题

在换了win10后发现seaborn的画出来的图很难看，基本上就是matplotlib的样子。想来肯定是主题和颜色样式没有设置好。今天看了下文档，补充下主题的设置。
seaborn的默认主题就是最好看的，如下：

import seaborn as sns
sns.set()           # 恢复默认主题，在win10中开始的时候要执行一次。
   
   
   
   
    
    
    
    1
    
    
    
    2

还有其他几个主题，包括：

sns.set_style("whitegrid")  # 白色网格背景
sns.set_style("darkgrid")   # 灰色网格背景
sns.set_style("dark")       # 灰色背景
sns.set_style("white")      # 白色背景
sns.set_style("ticks")      # 四周加边框和刻度
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

下面来几张图，发现就默认主题和白色网格背景是比较好看。

颜色

颜色一般来说用默认的颜色就好了，而且也比较好看，如果非要设置颜色，可以通过sns.set_palette("husl")设置。
常用的其他颜色模式还有：

sns.set_palette("muted")    # 常用
sns.set_palette("RdBu")
sns.set_palette("Blues_d")
sns.set_palette("Set1")
sns.set_palette("RdBu")
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5

效果如下图：

13.后话

这里只是简单说说seaborn常用的绘图函数而已，看seaborn官网上面有很多好看的图形样例，而这里的函数画出来的哪里有官网的好看啊。
而且这里也没有说到具体的布局控制，颜色主题等，要想绘制精美的图形，还需要学习具体的参数设定啊。

不过这里提到的这些简要图形，对于普通的分析快速绘图足够用了。

使用心得以后补充吧。

你可能感兴趣的:(Python)

如何用Python抓取股市数据并分析？ cda2024 python 开发语言
股市的数据分析是一个复杂而又充满挑战的过程。对于初学者来说，可能会觉得无从下手，但其实，只要掌握了正确的方法和工具，任何人都能成为股市数据分析的高手。今天，就让我们一起走进Python的世界，看看它是如何帮助我们从海量的数据中挖掘出有价值的信息。一、Python抓取股市数据（一）选择数据源首先，我们要确定一个可靠的数据源。常见的股票数据来源包括YahooFinance、GoogleFinance、
华为OD机试E卷 - 导师请吃火锅（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c语言华为OD机试E卷 c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述入职后，导师会请你吃饭，你选择了火锅。火锅里会在不同时间下很多菜。不同食材要煮不同的时间，才能变得刚好合适。你希望吃到最多的刚好合适的菜，但你的手速不够快，用m代表手速，每次下手捞菜后至少要过m秒才能再捞（每次只能捞一个）。那么用最合理的策略，最多能吃到多少刚好合适的菜？输入描述第一行两个整数n，m，其中n代表往锅里下
Python实现按键精灵(模拟鼠标移动，键盘按键，屏幕截图等)功能写python的鑫哥 Python课堂 python 自动化按键精灵鼠标移动键盘按键屏幕截图
前言本文是该专栏的第38篇，后面会持续分享python的各种干货知识，值得关注。在日常工作当中，有时候会需要你不停的去点击某个页面或者按钮或者其他事件操作等。又或是突发奇想，想利用python开发一个游戏的自动点击脚本等等。通常情况下，你可能会联想到“按键精灵”。而在本文中，笔者想要通过python去一一实现这些功能（鼠标移动，模拟键盘按键，屏幕截图等），也就是说，通过python去实现各种自动化
【LeetCode面试150】——21合并两个有序列表沈小农学编程 LeetCode leetcode 面试算法职场和发展 python c++
博客昵称：沈小农学编程作者简介：一名在读硕士，定期更新相关算法面试题，欢迎关注小弟！PS：哈喽！各位CSDN的uu们，我是你的小弟沈小农，希望我的文章能帮助到你。欢迎大家在评论区唠嗑指正，觉得好的话别忘了一键三连哦！题目难度：简单默认优化目标：最小化时间复杂度。Python默认为Python3。目录1题目描述2题目分析3算法框架以及代码实现3.1递归3.2迭代参考文献1题目描述将两个升序链表合并为
Python中常用的函数：map()详解 Sitin涛哥 Python python 开发语言
更多资料获取个人网站：ipengtao.comPython的map()函数是一个非常有用的工具，它可以对可迭代对象中的每个元素应用一个指定的函数，然后返回一个迭代器，其中包含了所有元素经过函数处理后的结果。本文将深入探讨map()函数的各种用法，并提供丰富的示例代码来帮助大家更好地理解。map()函数语法map()函数的基本语法如下：map(function,iterable,...)functi
华为OD机试E卷 --贪心歌手--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述一个歌手准备从A城去B城参加演出。按照合同，他必须在T天内赶到歌手途经N座城市歌手不能往回走每两座城市之间需要的天数都可以提前获知。歌手在每座城市都可以在路边卖唱赚钱。经过调研，歌手提前获知了每座城市卖唱的收入预期：如果在一座城市第一天卖唱可以赚M，后续每天的收入会减少D（第
Python跳动的爱心 Want595 python 开发语言
系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python漂浮爱心代码7Python爱心光波代码8Python普通的玫瑰花代码9Python炫酷的玫瑰花代码10Python多彩的玫瑰花代码节日系列1Python动漫风烟花秀代码2Python新年烟花
python创建pdf水印，希望根据文本长度调整水印字体大小，避免超出页面 Channing Lewis Python python pdf
为了根据文本长度动态调整水印字体大小，可以先测量文本长度，然后根据页面宽度和高度动态计算合适的字体大小。以下是修改后的代码：fromreportlab.pdfgenimportcanvasfromreportlab.lib.pagesizesimportletterfromreportlab.pdfbase.ttfontsimportTTFontfromreportlab.pdfbaseimpor
Python定义类的属性大数据张老师 python 开发语言
Python定义类的属性在Python的面向对象编程中，类的属性是用来描述类和对象的特征和数据的。类的属性可以分为两种：类属性和实例属性。本节将专注于如何定义类的属性，并讲解类属性和实例属性的区别与用法。什么是类的属性类的属性是用来存储数据的变量，它们可以在类的定义中直接声明。属性的主要作用是让类或对象能够存储数据，从而为行为（方法）提供数据支持。在类的内部，属性的定义和操作可以使用与普通变量类似
用python实战excel和word自动化重剑无锋1024 python excel word
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档python实现excel和word自动化--批量处理前言--需求快要期末了需要，提交一个年级的学生成绩数据，也就是几百份。当前我们收集了一份excel表格，它里面有学生的班级、姓名、成绩等信息。问题1：每个学生一个docx要有不同的文件名，要把文件名为班级+姓名（图片未改）问题2：每个docx文件中需要填写一些不一样的东西比如文件里
【python爬虫入门教程13--selenium的自动点击 --小小案例分享】重剑无锋1024 python 爬虫 selenium
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档《python爬虫入门教程12--selenium的安装与使用》selenium就是一个可以实现python自动化的模块，上次我们更新了如何安装以及它的语法。同时我也更新了如何用爬虫技术实现cookie免登录12306，再用selenium自动抢票。这个帖子主要是对selenium的一个语法讲解小案例，大家可以多运行试试。[免登录12
【《python爬虫入门教程12--重剑无峰168》】重剑无锋1024 python 爬虫开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档《python爬虫入门教程12--selenium的安装与使用》selenium就是一个可以实现python自动化的模块，上次我们更新了如何安装，这次我们来具体看看，它的语法，大家可以自己尝试一下，我的代码直接放在下面。前言一、selenium八种定位元素的方法1.完整示例代码二、总结。掌握这几种方法再在它们后面加入.click()或
用python解决潍坊期末概率填空题可以证明. python 开发语言
题目：一个点从数轴的原点开始运动，通过投掷骰子决定运动方向：若出现1，4面之一时，向负方向移动1个单位；若出现2，3，5，6面之一时，向正方向移动2个单位，（1）投掷1次骰子，该点位置的平均值为（）（2）投掷6次骰子后，概率大于的点的位置存在的最小区间为（）答案：1，[3,9]importrandom#投掷骰子的模拟defroll_dice():returnrandom.randint(1,6)#
【python】什么是对象 shanks66 python 开发语言
@[toc]python对象Object在Python中，对象（Object）是面向对象编程（OOP）的核心概念。对象是类的实例，类定义了对象的属性和行为。Python中的一切都是对象，包括数字、字符串、列表、函数等。对象的基本概念类（Class）：类是对象的蓝图或模板，定义了对象的属性和方法。通过类可以创建多个对象。对象（Object）：对象是类的实例，具有类定义的属性和方法。每个对象都有自己的
用Python写一个视频格式转换器 python狂徒 python 开发语言
一、怎样正确安装moviepy库笔者尝试用这两个命令行安装:“pipinstallmoviepy”、“pipinstall-ihttp://mirrors.aliyun.com/pypi/simple/moviepy”都不能成功。后来用这个命令行:“pipinstallmoviepy-ihttps://pypi.tuna.tsinghua.edu.cn/simple/”方能将此库安装完成。二、视频
【格式化输入输出】python基础啊吧啊吧， python 开发语言
1.在字符串开头的引导前加f或F，可以在{}中输入引用的变量age=20name='张三'a=f'Heis{name}{age}'print(a)2.想快速显示变量进行调试，可以用repr()或str()函数把值转化为字符串a='watchtv'print(str(a))print(repr(a))3.生成一组整齐的列，包含给定整数及其平方与立方
华为OD机试2024年E卷-单词接龙[100分]（ Java | Python3 | C++ | C语言 | JsNode | Go）实现100%通过率梅花C 华为OD题库算法华为od java c++c语言 golang
点这里去解决这道题Go!题目描述单词接龙的规则是：可用于接龙的单词首字母必须要前一个单词的尾字母相同；当存在多个首字母相同的单词时，取长度最长的单词，如果长度也相等，则取字典序最小的单词；已经参与接龙的单词不能重复使用。现给定一组全部由小写字母组成单词数组，并指定其中的一个单词作为起始单词，进行单词接龙，请输出最长的单词串，单词串是单词拼接而成，中间没有空格。输入描述输入的第一行为一个非负整数，表
MySQL数据库表的设计 weixin_34289744 数据库 python
2019独角兽企业重金招聘Python工程师标准>>>表的约束主键约束createtablestudent(idintprimarykey,namevarchar(40));createtablestudent(idintprimarykeyauto_increment,namevarchar(20));唯一约束createtablestudent(idintprimarykeyauto_incr
python转换视频格式为mp4 宁君 Python python
1.第一种方法电脑下载安装ffmpeg方法见mac电脑安装ffmpeg两种方法然后代码如下frommoviepy.editorimportVideoFileClipimportosimportffmpegdefconvert_video_to_mp4(input_video_path,output_video_path):'''速度慢,CPU狂飙:paraminput_video_path::pa
华为OD机试E卷 --寻找符合要求的最长子串 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给你一个字符串s，字符串s首尾相连成一个环形，请你在环中找出‘l’、‘o’、‘x’字符都恰好出现了偶数次最长子字符串的长度。输入描述输入是一串小写的字母组成的字符串输出描述输出是一个整数备注•1≤s.length≤5*10^5•s只包含小写英文字母用例输入alolobo输出6
华为OD机试E卷 --最大值--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给定—组整数(非负)，重排顺序后输出一个最大的整数。示例1输入:[10,9]输出:910说明:输出结果可能非常大，所以你需要返回一个字符串而不是整数。输入描述数字组合输出描述最大的整数用例输入109输出910说明无题目解析给定一组非负整数，我们需要对这些整数进行重排，使得重新
华为OD机试C卷-- 字符串变换最小字符串（Java & JS & Python & C）飞码创造者华为OD机试题库华为od c语言 java javascript python
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述给定一个字符串s，最多只能进行一次变换，返回变换后能得到的最小字符串（按照字典序进行比较）。变换规则：交换字符串中任意两个不同位置的字符。输入描述一串小写字母组成的字符串s输出描述按照要求进行变换得到的最小字符串。备注s是都是小写字符组成1≤s.
【Triton 教程】持久矩阵乘法 (Persistent Matmul)
Triton是一种用于并行编程的语言和编译器。它旨在提供一个基于Python的编程环境，以高效编写自定义DNN计算内核，并能够在现代GPU硬件上以最大吞吐量运行。更多Triton中文文档可访问→https://triton.hyper.ai/该脚本展示了使用Triton进行矩阵乘法的持久化内核实现(persistentkernelimplementations)。包含多种矩阵乘法方法，例如基础的朴
《CPython Internals》阅读笔记：p151-p151 python
《CPythonInternals》学习第9天，p151-p1510总结，总计1页。一、技术总结无。二、英语总结(生词：1)1.marshal(1)marshalingMarshallingormarshaling(USspelling)istheprocessoftransformingthememoryrepresentationofanobjectintoadataformsuitablef
python实现自动登录12306抢票 -- selenium python
python实现自动登录12306抢票--selenium前言其实网上也出现了很多12306的代码，但是都不是最新的，我也是从网上找别人的帖子，看B站视频，然后写成了这个程序，想分享一下。其中我会说自己遇到的问题以及自己的一个改进。一、遇到的问题？1.url-正确的表头：就是首先url不要写错了，然后一定要加正确的表头，才可以拿到数据，就是我日期填写错误，然后生成的url就有问题，浪费了好多时间。
Python单例模式中的问题后端python
一、装饰器形式的单例模式首先先给出Python中装饰器的单例模式：python代码解读复制代码importthreadingdefsingleton(cls):_instances={}_lock=threading.Lock()defget_instance(*args,**kwargs):ifclsnotin_instances:with_lock:ifclsnotin_instances:_
《CPython Internals》阅读笔记：p118-p150 python
《CPythonInternals》学习第8天，p118-p150总结，总计33页。一、技术总结补充一些本人整理的关于Context-FreeGrammar(CFG)的知识。1.symbol(符号)Amathematicalsymbolisafigureoracombinationoffiguresthatisusedtorepresentamathematicalobject（符号是一个数字或数
巧夺天工：VSCode Python 终端环境隔离的背后原理
每个写Python的小伙伴都会感慨，VSCode对Python环境的支持太好了！当你切换Python解释器后，新开的终端会自动激活对应的环境，不同项目互不干扰，用起来简直不要太舒服。但是，你知道这背后的实现原理吗？终端环境隔离的本质：环境变量首先，我们要理解终端中环境激活的本质。当我们在终端中执行sourcevenv/bin/activate或condaactivateenv_name时，这些命令
为什么在 Python 中 hash(-1) == hash(-2)? python
英文：https://omairmajid.com/posts/2021-07-16-why-is-hash-in-python作者：OmairMajid译者：豌豆花下猫&Claude-3.5-Sonnet时间：原文发布于2021.07.16，翻译于2025.01.11收录于：Python为什么系列https://github.com/chinesehuazhou/python-whydo当我在等
《CPython Internals》阅读笔记：p97-p117 python
《CPythonInternals》学习第7天，p97-p117总结，总计21页。一、技术总结1.词法分析(lexicalanalysis)根据《Compilers-Principles,Techniques,andTools》(《编译原理》第2版)第5页：Thefirstphaseofacompileriscalledlexicalanalysisorscanning.Thelexcicalan
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc