风极_陨

机器学习——可视化库Seaborn

seaborn是在matplotlib上的更高一级，它其实只是对matplotlib的一个补充，不能说它能够替代matplotlib，最显著的就是它可以美化图像。
为了让matplotlib更美观，seaborn提供了一些控制图表外表的方法。seaborn中可有5种主题供我们选择：
1、darkgrid（灰色网格）
2、whitegrid（白色网格）
3、dark（白色主题）
4、ticks（十字叉）
5、white（黑色主题）

首先需要导入import seaborn as sns这句话，前提是已经通过pip或者Anaconda安装好了seaborn库，下面就来学习一下：
这里需要注意一点的是，取文件名的时候千万不要跟包名一样，否则一定会报错说找不到“moudle”。

颜色绘图

调用seaborn的默认模板
我们可以使用sns.set()取seaborn的默认值，也就是默认主题。

# sns.set()   #seaborn的默认取值
x=np.linspace(0,14,100)    #x的取值为（0,14），共有100个点
for i in range(0,6):
    plt.plot(x,np.sin(x+i*0.5)*(6-i))
plt.show()

在没有加入sns.set()这句话之前，图表的显示结果为：

背景是一片白。加入sns.set()这句话之后：

sns.set()#seaborn的默认取值
x=np.linspace(0,14,100)    #x的取值为（0,14），共有100个点
for i in range(0,6):
    plt.plot(x,np.sin(x+i*0.5)*(6-i))
plt.show()

图表的显示结果为：

这样看数据的时候感觉就比较好。

seaborn的其它风格
1、这里使用“whitegrid”这种主题试试看：

sns.set_style("whitegrid")#seaborn的whitegrid风格
x=np.linspace(0,14,100)    #x的取值为（0,14），共有100个点
for i in range(0,6):
    plt.plot(x,np.sin(x+i*0.5)*(6-i))
plt.show()

运行结果：

2、这里使用“ticks”这种主题试试看：

这里的区别就是x轴和y轴有刻度标识。

距离轴线的距离
对于图表，我们想让它距离x轴和y轴远一点，可以使用seaborn.despine(offset=?)这个方法。

sns.set_style("ticks")#seaborn的whitegrid风格
x=np.linspace(0,14,100)    #x的取值为（0,14），共有100个点
for i in range(0,6):
    plt.plot(x,np.sin(x+i*0.5)*(6-i))

sns.despine(offset=100)
plt.show()

运行结果：

轴线的显示与隐藏
在坐标轴中我们也可以使用seaborn.despine()来显示和隐藏坐标轴，只留下刻度数字。效果图如下（隐藏左边y轴的线）：

上图中，可以看到y轴的线被隐藏了，我们也可以显示上面和右面的线，效果图如下：

所有操作，都可以在seaborn.despine()中来实现。代码如下：

sns.set_style("ticks")#seaborn的whitegrid风格
x=np.linspace(0,14,100)    #x的取值为（0,14），共有100个点
for i in range(0,6):
    plt.plot(x,np.sin(x+i*0.5)*(6-i))
# True表示隐藏，False表示显示，默认为False
#sns.despine(top=False,right=False)     #显示上面和右边的线
sns.despine(left=True)   #隐藏左边的线
plt.show()

注意，这些语句要写在plt.show()的前面，不然不会有任何改变。

不同主题的子图
在一张大图上，我们也可以画不同主题的子图，具体子图的画法详见上篇机器学习——数据可视化库Matplotlib，这里可以使用with sns.axes_style(“ticks”)来划分一个域。

"""可以使用with sns.axes_style("ticks"):域将子图进行分隔设置"""
def y_sinx(flip=1):
    x = np.linspace(0, 14, 100)  # x的取值为（0,14），共有100个点
    for i in range(0, 6):
        plt.plot(x, np.sin(x + i * 0.5) * (6 - i)*flip)
# 第一张子图的风格
with sns.axes_style("ticks"):
    plt.subplot(2, 1, 1)
    y_sinx(1)

#第二张子图的风格
with sns.axes_style("dark"):
    plt.subplot(2, 1, 2)
    y_sinx(-1)
plt.show()

运行结果：

线，图的另外形式风格
这里有一个seaborn.set_context()函数，这里可以设置一些图表的风格。

sns.set()   #使用默认风格
def y_sinx(flip=1):
    x = np.linspace(0, 14, 100)  # x的取值为（0,14），共有100个点
    for i in range(0, 6):
        plt.plot(x, np.sin(x + i * 0.5) * (6 - i)*flip)
sns.set_context(context="paper")
y_sinx(1)
plt.show()

1、当sns.set_context(context="paper")中为“paper”时，结果如下：

2、当sns.set_context(context="talk")中为“talk”时，结果如下：

可以看到，线宽，字体都变得有些大了。
3、当sns.set_context(context="poster")中为“poster”时，结果如下：

可以看到，线宽，字体变得更大了。
当我在sns.set_context(context="paper")的基础上增加两个参数值时：sns.set_context(context="paper",font_scale=2,rc={"lines.linewidth":1.5})，第二个参数表示字体大小，第三个参数表示线的粗细。显示结果如下：

可以看到，跟sns.set_context(context="paper")的结果比较，字体，线的粗细都有明显变化。

调色板
seaborn中还支持多种颜色：
1、color_palette()能传入任何matplotlib所支持的颜色
2、color_palette()不写参数则默认颜色
3、set_palette()设置所有图的颜色

sns.set(rc={"figure.figsize":(6,6)})   #定义画板的大小为（6,6）
current_palette=sns.color_palette()    #默认颜色
sns.palplot(current_palette)
plt.show()

运行结果：

可以看到，seaborn中的默认颜色为以上10种颜色，几乎以深色颜色为主。
当我有10种以上颜色时要怎么办？这里最常用的是“hls”颜色空间，里面传入这样的参数就可以了：sns.color_palette("hls",12)
实例：

sns.set(rc={"figure.figsize":(6,6)})   #定义画板的大小为（6,6）
#current_palette=sns.color_palette() #默认颜色
current_palette=sns.color_palette("hls",12)    #12种颜色
sns.palplot(current_palette)
plt.show()

运行结果：

上图中就出现了总共12种颜色的调色板。

饱和度和亮度

我们还可以调整饱和度和亮度，这里使用.hls_palette()方法。

"""
1、l->亮度（lightness）
2、s->饱和度（saturation）
"""
sns.set(rc={"figure.figsize":(6,6)})   #定义画板的大小为（6,6）
# current_palette=sns.color_palette("hls",12)    #12种颜色
sns.palplot(sns.hls_palette(12,l=0.8,s=0.9))
plt.show()

运行结果：

调色板传颜色

data=np.random.normal(size=(20,8))+np.arange(8)/2
sns.boxplot(data=data,palette=sns.color_palette("hls",8))
plt.show()

运行结果：

这里就把12种颜色一一绘制出来了，并且没有任何重叠。

成对出现相近颜色
使用color_palette()还可以成对的出现相近的颜色

sns.set(rc={"figure.figsize":(6,6)})   #定义画板的大小为（6,6）
# current_palette=sns.color_palette("hls",12)    #12种颜色
sns.palplot(sns.color_palette("Paired",8))
plt.show()

运行结果：

使用xkcd颜色来命名颜色
xkcd使用了一套众包努力的针对随机RGB色的命名。产生了954个可以随机通过xkcd_rgb字典中调用的命名颜色。

plt.plot([0,1],[0,1],sns.xkcd_rgb["pale red"],lw=3)  #分别为x轴取值，y轴取值，颜色，线宽
plt.plot([0,1],[0,2],sns.xkcd_rgb["medium green"],lw=3)  #分别为x轴取值，y轴取值，颜色，线宽
plt.plot([0,1],[0,3],sns.xkcd_rgb["denim blue"],lw=3)  #分别为x轴取值，y轴取值，颜色，线宽
plt.show()

运行结果：

这里只绘制三种颜色，其余的可在官网去查。

上面讲的都是离散型的画板，下面讲连续型画板。色彩会随数据变化，比如数据越来越重要，颜色则会越来越深。

连续画板（颜色深浅变化）

sns.palplot(sns.color_palette("Blues"))  #绘制一个蓝色，从浅到深
plt.show()

运行结果：

可以看到，颜色是越来越深的，如果想要从深到浅，则需要添加一个“_r”后缀。如：

sns.palplot(sns.color_palette("Blues_r"))  #绘制一个蓝色，从深到浅
plt.show()

运行结果：

连续画板（调用函数实现颜色深浅变化）
1、light_palette() 从浅到深
2、dark_palette() 从深到浅

从浅到深：

sns.palplot(sns.light_palette("green",8))  #从浅到深
plt.show()

运行结果：

从深到浅：

sns.palplot(sns.dark_palette("green",8))  #从深到浅
plt.show()

运行结果：

当然也可以直接使用light_palette()或dark_palette() 而不替换，现在进行下面操作进行颜色反转：

sns.palplot(sns.light_palette("green",reverse=True,n_colors=8))  #从浅到深,反转，变成从深到浅
# sns.palplot(sns.dark_palette("green",reverse=True,n_colors=8))  #从深到浅,反转,变成从浅到深
plt.show()

运行结果：

# sns.palplot(sns.light_palette("green",reverse=True,n_colors=8))  #从浅到深,反转，变成从深到浅
sns.palplot(sns.dark_palette("green",reverse=True,n_colors=8))  #从深到浅,反转,变成从浅到深
plt.show()

运行结果：

连续画板（调用函数实现颜色深浅变化-实例）

x,y=np.random.multivariate_normal([0,0],[[1,-0.5],[-0.5,1]],size=300).T
pal=sns.dark_palette("green",as_cmap=True)
sns.kdeplot(x,y,cmap=pal)   #核密度估计图
plt.show()

运行结果：

这个可以很容易看出来，绿色从外向里逐渐变浅。

线性变换
在color_palette()中,里面可以填写“cubehelix”，可以让当前的亮度和饱和度做线性变换。

sns.palplot(sns.color_palette("cubehelix",8))
plt.show()

运行结果：

也可以指定一个区间：

sns.palplot(sns.cubehelix_palette(8,start=0.2,rot=0.95))  #8个颜色，0.2-0.95的区间
plt.show()

运行结果：

数据分析绘图

直方图数据绘制

sns.set()  #设置默认主题
x=np.random.normal(size=100)  #产生制定分布的数值，正太分布
sns.distplot(x,kde=False)  #绘制直方图
plt.show()

运行结果：

上图中默认把数据切分成10块，即bins=10，我现在要把数据切分成更多。只需要改变bins的值就行了。

sns.set()  #设置默认主题
x=np.random.normal(size=100)  #产生制定分布的数值，正态分布
# sns.distplot(x,kde=False)  #绘制直方图
sns.distplot(x,bins=20,kde=False)
plt.show()

运行结果：

根据均值和协方差生成数据
上面的直方图都是只针对一个特征进行的，那么特征与特征之间就不适用于直方图了，这里最好使用散点图绘制。
生成一些均值和协方差的数据：

mean,cov=[0,1],[(0.5,1),(1,1.5)]
data=np.random.multivariate_normal(mean,cov,200)#根据实际情况生成一个多元正态分布矩阵
df=pd.DataFrame(data,columns=["x","y"])
print(df)

运行结果：

绘制散点图：
在seaborn中可以使用seaborn.jointplot()方法来绘制散点图，同时它还会把每一个维度（这里表示x和y两个变量）的直方图绘制出来。

sns.set()
sns.jointplot(x="x",y="y",data=df)
plt.show()

运行结果：

散点图虽然比较明显，但是当数据比较多的时候，就不知道哪些地方的点比较密集，在seaborn.jointplot()中的参数中有这么一句话“kind=“hex””，这样可以把散点图变成如下模样：

通过判别颜色的方法来判断哪个地方颜色比较深。颜色越深的地方密集的点越多。
代码：

mean,cov=[0,1],[(0.5,1),(1,1.5)]
sns.jointplot(x="x",y="y",data=df)
with sns.axes_style("white"):
    x,y=np.random.multivariate_normal(mean,cov,500).T
    sns.jointplot(x=x,y=y,kind="hex")
plt.show()

数据分析绘图

“鸢尾花”数据集我们应该都不陌生，里面有4个特征，分别是花瓣的长度宽度、花萼的长度宽度。如果有csv或excel文件，可以用pandas读进来，但其实seaborn这个库已经内置了“鸢尾花”的数据集，现在我们想要比较两两特征之间的关系，可以使用sns.pairplot(iris)绘制。
使用如下代码：

iris=sns.load_dataset("iris")  #读取鸢尾花数据集
sns.pairplot(iris)             #绘图（直方图、散点图）
plt.show()

显示结果：

上图中，我们可以看到，斜对角线上全是直方图，其余的都是散点图。这是因为对角线上是单变量的对应情况，散点图是双变量的对应情况。

指定某两列绘制scatter图

我现在选择上面两列（已标注）的数值进行绘图，写下sns.pairplot(data=iris,vars=["sepal_length","petal_length"],hue="species")代码就可以，重点在于vars=["",""]。

sns.set()
iris=sns.load_dataset("iris")  #读取内置数据集iris
print(iris.head())
g=sns.pairplot(data=iris,vars=["sepal_length","petal_length"],hue="species")
g.map(plt.scatter)
plt.show()

运行结果：

回归模型绘制
seaborn中内置了许多数据集，这里以“tips”为例

sns.set()
tips=sns.load_dataset("tips")   #读取内置数据集tips
print(tips.head())    #打印前5项数据看看

我们来看看打印出来的数据集：

上图中，该数据集分别表示：
total_bill:某饭店消费付款金额；
tip：顾客给的小费；
sex：顾客性别
smoker：顾客是否吸烟；
day：星期几；
time：早中晚；
size：当前店内的顾客人数。

在seaborn中，我们可以使用regplot()和implot()来绘制线性关系，初学时推荐使用regplot()，下面就来绘制线性关系。

sns.regplot(x="total_bill",y="tip",data=tips)  #绘制线性关系
plt.show()

代码中的x=“total_bill”,y="tip"分别是该数据集中的某两列，data=tips表示该数据集。
运行结果：

当我把上面代码中的sns.regplot(x="total_bill",y="tip",data=tips)变成sns.regplot(x="size",y="total_bill",data=tips)，只是换了两列而已，输出的结果是这样的：

因为x轴的数都是整数，不是一个连续的值，所以它不太适合用来做回归分析，当数据不太满足分析的要求时，我们也可以对数据做一个很小很小的抖动，我在sns.regplot(x="size",y="total_bill",data=tips)这句代码中多写一个参数，变成sns.regplot(x="size",y="total_bill",data=tips,x_jitter=0.05)，让x轴的数值增加或减少0.05，使其在原始点上上下浮动，输出的结果如图所示：

通过小范围的变化数值，使它能够不太能构成一些离散值，这样建立的回归模型会比原来相对准确一些。

数值偏移重叠
有这么一个事，当数据有重叠时，会影响我们进行数据的分析，所以我们要将它进行适当的偏移。
比如，原图是这样：

数据来源还是来源于seaborn的内置数据集“tips”，现在我们使用sns.stripplot()这个方法，让上图中的点进行适当的偏移，但是又不稍那么大的改变数值表示的含义。

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
sns.stripplot(x="day",y="total_bill",data=tips,jitter=True)  #jitter=True本来就是默认的，也可以不写
plt.show()

当然，上面sns.stripplot(x="day",y="total_bill",data=tips,jitter=True)中，jitter=True本来就是默认的，也可以不写。
运行结果：

除了上面的以外，seaborn中还有sns.swarmplot()，它的效果不像sns.stripplot()那样数值来回晃，它更像一颗圣诞树，如下图所示：

具体代码：

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
# sns.stripplot(x="day",y="total_bill",data=tips,jitter=True)  #jitter=True本来就是默认的，也可以不写
sns.swarmplot(x="day",y="total_bill",data=tips)
plt.show()

当然，我们还可以给sns.swarmplot(x="day",y="total_bill",data=tips)添加“hue”属性，其实，在许多画图方法当中都可以添加“hue”属性，这里我们添加hue属性，看看效果如何(这里hue=“sex”，表示按照数据集中的“sex”列进行划分)：

上面的这图有点像一棵棵树，我们暂且把它叫做“树形图”，这样给人的感觉就有点高大上了…
具体代码：

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
#sns.stripplot(x="day",y="total_bill",data=tips,jitter=True)  #jitter=True本来就是默认的，也可以不写
#sns.swarmplot(x="day",y="total_bill",data=tips)
sns.swarmplot(x="day",y="total_bill",data=tips,hue="sex")
plt.show()

seaborn盒图
下面先说说这样一个概念，有一份数据，统计了一个学校所有男生的身高，普遍在1.5-1.8之间，但是，突然有几个数据达到了2.2或1.1，那么这几个数据就有可能是统计错误的，我们把它们称作离群点，这时盒图的作用就体现出来了，它可以很直观的看到离群点的分布状况。
此时我们引入IQR的概念，即四分位距：第1/4位与3/4位的距离（如果数据点为100，则该位置在25-75之间），N=1.5*IQR，如果一个值X>第3/4位+N，或X<1/4位-N，则点X位离群点。

代码：

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
sns.boxplot(x="day",y="total_bill",data=tips,hue="time")  #盒图
plt.show()

运行结果：

seaborn盒图水平画
在sns.boxplot()中国指定属性“orient=“h””就可以让盒图水平翻转

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
sns.boxplot(data=tips,orient="h")  #盒图
plt.show()

运行结果：

seaborn小提琴图

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
sns.violinplot(x="day",y="total_bill",data=tips,hue="sex")  #小提琴图
plt.show()

小提琴的“胖瘦”反映了数据的密集度，，如下图所示：

上面的图这样看着很不舒服，我们这样写：

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
# sns.violinplot(x="day",y="total_bill",data=tips,hue="sex")  #小提琴图
sns.violinplot(x="day",y="total_bill",data=tips,hue="sex",split=True)  #小提琴图,合并
plt.show()

运行结果：

我们把同一天的男女比例合并起来，就能很明显比较了。

绘图合并
当然我们也可以把两种类型的图片合在一起，使用1个plt.show()就可以了。这里把树形图和小提琴图合在一起。

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
sns.swarmplot(x="day",y="total_bill",data=tips,hue="sex")  #树形图
sns.violinplot(x="day",y="total_bill",data=tips,hue="sex",split=True)  #小提琴图,合并
plt.show()

运行结果：

条形图
显示值的集中趋势可以用条形图。这里使用seaborn的内置数据集“titanic”，“泰坦尼克人员存活数据集”。
具体的数据如下：

sns.set()
titanic=sns.load_dataset("titanic")  #titanic
print(titanic.head())
sns.barplot(x="sex",y="survived",hue="class",data=titanic)     #条形图,泰坦尼克人员男女在不同舱位之间的存货率分析
plt.show()

运行结果：

上图表示了不同舱位（一、二、三等）的男女幸存几率。

点图
点图可以更好地描述变化差异。

sns.set()
titanic=sns.load_dataset("titanic")  #titanic
print(titanic.head())
sns.pointplot(x="sex",y="survived",hue="class",data=titanic)     #点图,泰坦尼克人员男女在不同舱位之间的存货率分析
plt.show()

运行结果：

上图中，男性和女性之间的存活率的值都用比较大的圆点标了出来。

多层面板分类图
有这么一个函数seaborn.factorplot(),通过输入不同的参数，它几乎封装了所有图，如条形图，折线图，盒图…
当它是默认，也就是不输入任何参数，它默认输出折线图

sns.set()
titanic=sns.load_dataset("titanic")  #titanic
print(titanic.head())
sns.factorplot(x="sex",y="survived",hue="class",data=titanic)  #默认折线图
plt.show()

运行结果：

这与上图中的点图就是一样的。
当我想要更换其它图时，这个函数就需要填写参数，即kind=“xxx”，比如条形图：kind=“bar”

sns.set()
titanic=sns.load_dataset("titanic")  #titanic
print(titanic.head())
#sns.factorplot(x="sex",y="survived",hue="class",data=titanic)  #默认折线图
sns.factorplot(x="sex",y="survived",hue="class",data=titanic,kind="bar")  #条形图
plt.show()

运行结果：

也可以添加维度：
输入col=""，就可以同时显示几列。

sns.set()
titanic=sns.load_dataset("titanic")  #titanic
print(titanic.head())
#sns.factorplot(x="sex",y="survived",hue="class",data=titanic)  #默认折线图
#sns.factorplot(x="sex",y="survived",hue="class",data=titanic,kind="bar")  #条形图
sns.factorplot(x="sex",y="survived",hue="class",col="pclass",data=titanic,kind="bar")
plt.show()

运行结果：

seaborn.factorplot()可能会用到的一些参数：

每个变量的翻译解释：

Facetgrid使用方法

当我们想把数据集当中的许多子集进行展示的时候，我们就可以用这个函数了。
Facetgrid创建空白子图

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
g=sns.FacetGrid(data=tips,col="time")   #以time为基准，创建col个子图，这里time只有lunch和dinner
plt.show()

运行结果：

Facetgrid绘制子图-单变量
接下来我们就来绘制子图中的内容。

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
g=sns.FacetGrid(data=tips,col="time")   #以time为基准，创建col个子图，这里time只有lunch和dinner
g.map(plt.hist,"tip")   #单变量，绘制子图中的内容
plt.show()

运行结果：

Facetgrid绘制子图-多变量
直方图适合于单变量，多变量可以使用散点图。

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
g=sns.FacetGrid(data=tips,col="time",hue="smoker")   #以time为基准，创建col个子图，这里time只有lunch和dinner
g.map(plt.scatter,"total_bill","tip")   #多变量，散点图，绘制子图中的内容
g.add_legend()    #添加图注
plt.show()

运行结果：

Facetgrid绘制子图-设置大小布局

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
g=sns.FacetGrid(data=tips,col="time",hue="smoker",size=5)   #在点的大小不变的情况下把图变大
g.map(plt.scatter,"total_bill","tip")   #多变量，散点图，绘制子图中的内容
g.add_legend()    #添加图注
plt.show()

运行结果：

当然，我们也可以加上这个属性：hue_kws={"marker":["","v"]}，把图中的小点变成三角形。

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
# g=sns.FacetGrid(data=tips,col="time",hue="smoker",size=5)   #在点的大小不变的情况下把图变大
g=sns.FacetGrid(data=tips,col="time",hue="smoker",size=5,hue_kws={"marker":["","v"]})   #在点的大小不变的情况下把图变大
g.map(plt.scatter,"total_bill","tip")   #多变量，散点图，绘制子图中的内容
g.add_legend()    #添加图注
plt.show()

运行结果：

Facetgrid绘制子图-自定义显示x轴和y轴数值
这里可以使用.set()方法进行设置。

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
g=sns.FacetGrid(data=tips,col="time",hue="smoker",size=5)   #在点的大小不变的情况下把图变大

g.map(plt.scatter,"total_bill","tip")   #多变量，散点图，绘制子图中的内容
g.add_legend()    #添加图注
g.set(xticks=[10,30,50],yticks=[2,4,6,8])  #只显示x轴的10，30，50的点，只显示y轴的2，4，6，8的点
plt.show()

运行结果：

Facetgrid绘制子图-改变显示顺序
原来的图如果是这样：

它是按照Thur->Fri->Sat->Sun的顺序显示的，我现在想要它按照Fri->Thur->Sun->Sat顺序显示，可以使用pandas中的“Categorical”函数进行index的调换。
seaborn.FacetGrid()默认读取DataFrame的格式数据，而pandas的数据格式就是DataFrame，所以最好使用pandas进行处理。

sns.set()
tips=sns.load_dataset("tips")  #读取内置数据集tips
print(tips.head())
orderd_days=pd.Categorical(['Fri','Thur','Sun','Sat'])
g=sns.FacetGrid(data=tips,row="day",size=1.7,row_order=orderd_days)   #在点的大小不变的情况下把图变大
g.map(sns.boxplot,"total_bill")

plt.show()

运行结果：

这样就实现了数据位置的替换。

热度图绘制

什么是热度图？比如说现在我们有一群离散点，它里面有的值比较大，有的值比较小，我们可以用颜色的深浅来表示，如果值越大，则颜色越深，这样看起来就十分显眼。

绘制热度图使用seaborn.heatmap()这个函数，现在随机定义一组数据，绘制一张热度图。

sns.set()
uniform_data=np.random.rand(3,3)  #随机定义一个3*3的矩阵
print(uniform_data)
sns.heatmap(uniform_data)
plt.show()

运行结果：
随机输出的数据：

图像结果：

上图中，右侧有条形的调色板，在打印输出的矩阵中，可以看到值只要越接近0.2，颜色越黑。
注意：上图中由此调色板的最底部及最顶部的值就是数据集中的最小值与最大值。
也可以在该函数中添加最大最小值，当矩阵中的值小于最小值，则它等于最小值，当矩阵中的值大于最大值，则等于最大值，比如：

sns.set()
uniform_data=np.random.rand(3,3)  #随机定义一个3*3的矩阵
print(uniform_data)
# sns.heatmap(uniform_data)
sns.heatmap(uniform_data,vmin=0.2,vmax=0.6)  #最小值0.2，最大值0.6
plt.show()

运行结果：
随机输出的数据：

图片结果：

可以看到，坐标为（1，1）和（2，2）的色块都是黑色，因为它们大于0.5，所以被截断成0.5，故都为黑色。

热度图绘制_中间值
如果有一批正负数的数据，那么最好以0为中心来区分开颜色。

sns.set()
uniform_data=np.random.randn(3,3)  #随机定义一个3*3的矩阵，有正有负
print(uniform_data)
# sns.heatmap(uniform_data)
sns.heatmap(uniform_data,center=0)  #中心值为0
plt.show()

打印输出的矩阵：

图片结果：

上图中，右侧调色板有0.0这个值，如果是正数，则是别的颜色，如果是负数，则是另外的颜色，色差也比较大。

热度图绘制_航班信息绘制
seaborn中内置了"flights"这样一个简单的数据集，它的具体内容如下：

分别表示年，月，以及当月乘坐航班的总人数。现在就用热度图来绘制一下航班信息。

sns.set()
flights=sns.load_dataset("flights")   #读取内置的航班数据集
print(flights.head())
flights=flights.pivot("month","year","passengers") #把它转化成一个二维数据，横轴是year，纵轴是month，值是passengers
sns.heatmap(flights)
plt.show()

运行结果：

当然,如果颜色很接近，也没法看，这时可以把原来的数值放进去。

sns.set()
flights=sns.load_dataset("flights")   #读取内置的航班数据集
print(flights.head())
flights=flights.pivot("month","year","passengers") #把它转化成一个二维数据，横轴是year，纵轴是month，值是passengers
# sns.heatmap(flights)
sns.heatmap(flights,annot=True,fmt="d") #annot=True表示把值显示在图中，fmt="d"表示数字的一种字体
plt.show()

显示结果：

注意：代码sns.heatmap(flights,annot=True,fmt="d") #annot=True表示把值显示在图中，fmt="d"表示数字的一种字体中的"fmt=“d”"千万不要省略，否则图中的值会是一些科学计数值：

这样的值显然是我们不需要的，所以，"fmt=“d”"千万要加上。
上面的图虽然有数值，但是看着也不顺眼，我们再来美化一下：

sns.set()
flights=sns.load_dataset("flights")   #读取内置的航班数据集
print(flights.head())
flights=flights.pivot("month","year","passengers") #把它转化成一个二维数据，横轴是year，纵轴是month，值是passengers
# sns.heatmap(flights)
sns.heatmap(flights,annot=True,fmt="d",linewidths=0.5) #annot=True表示把值显示在图中，fmt="d"表示数字的一种字体
plt.show()

我们在sns.heatmap()中加上"linwidths"这个属性，它表示色块与色块之间的间距。
运行结果：

上图是不是就看着舒服了一些呢？

热度图绘制_自定义颜色

sns.set()
flights=sns.load_dataset("flights")   #读取内置的航班数据集
print(flights.head())
flights=flights.pivot("month","year","passengers") #把它转化成一个二维数据，横轴是year，纵轴是month，值是passengers
sns.heatmap(flights,annot=True,fmt="d",linewidths=0.5,cmap="YlGnBu") #annot=True表示把值显示在图中，fmt="d"表示数字的一种字体
plt.show()

运行结果：

具体的其它颜色可以去查询参考手册。

热度图绘制_调色板隐藏
如果不想要上图中的调色板，我们也可以进行隐藏：

sns.set()
flights=sns.load_dataset("flights")   #读取内置的航班数据集
print(flights.head())
flights=flights.pivot("month","year","passengers") #把它转化成一个二维数据，横轴是year，纵轴是month，值是passengers
sns.heatmap(flights,annot=True,fmt="d",linewidths=0.5,cmap="YlGnBu",cbar=False) #annot=True表示把值显示在图中，fmt="d"表示数字的一种字体
plt.show()

运行结果：

可以看到，调色板被隐藏了，但是不建议这么做。

你可能感兴趣的:(机器学习-学习记录)

Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
「日拱一码」033 机器学习——严格划分胖达不服输「日拱一码」机器学习人工智能严格划分组划分
目录简单随机划分（train_test_split）分组划分（GroupSplitting）简单分组划分(GroupSplitting)分层分组划分(StratifiedGroupSplitting)交叉验证法（Cross-Validation）分组K折交叉验证（GroupKFold）留一组法（LeaveOneGroupOut）简单随机划分（train_test_split）简单随机分组通过随机分
从零开始：搭建你的人工智能开发环境人工智能教程人工智能 YOLO 机器学习 transformer 线性回归动态规划排序算法
前言在人工智能和机器学习的旅程中，一个稳定且高效的开发环境是成功的关键第一步。无论是初学者还是经验丰富的开发者，一个配置良好的开发环境都能大大提高工作效率，减少遇到的问题。本文将从零开始，逐步指导你如何搭建一个完整的人工智能开发环境，包括操作系统选择、Python安装、常用库的配置以及开发工具的选择。一、选择合适的操作系统（一）主流操作系统介绍在搭建人工智能开发环境时，首先需要选择一个合适的操作系
智能体学习记录一罗同学213 学习
智能体是什么智能体（IntelligentAgent）是一种能够感知周围环境、自主决策并执行行动以实现特定目标的智能化系统或程序。它可以是软件（如聊天机器人）、硬件（如机器人），或两者结合的实体，核心特征包括：自主性：无需人工实时干预，独立运行（如自动驾驶车辆避障）。反应性：实时感知环境变化并快速响应（如智能家居调节温度）。目标导向：基于预设目标优化行动（如推荐系统最大化用户点击率）。学习能力：通
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
通俗易懂：什么是决策树？淦暴尼算法 python 决策树算法机器学习
1.引言：决策树就像“选择题”你是否曾经在生活中做过“选择题”？比如：今天要不要带伞？晚饭吃什么？该不该买那件心仪已久的商品？其实，我们的大脑经常会像“决策树”一样，通过一连串问题和判断，逐步缩小选择范围，最终做出决定。**决策树（DecisionTree）**就是这样一种模拟人类决策过程的机器学习模型。它通过“提问-分支-决策”的方式，把复杂问题拆解成一系列简单的判断，广泛应用于分类（如判断邮件
java毕业设计-基于Javaweb的家常小菜烹饪学习管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿刘 vue spring boot 毕业设计 java 课程设计学习
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费开题报告、任务书、全bao定制+
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
计算机专业大数据毕业设计-基于 Spark 的音乐数据分析项目(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥数据可视化计算机毕设 spark 大数据课程设计 spark
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
Protein FID：AI蛋白质结构生成模型评估新指标
一、引言：蛋白质生成模型面临的评估挑战近年来，AI驱动的蛋白质结构生成模型取得了令人瞩目的进展，但如何有效评估这些模型的质量却一直是一个悬而未决的问题。虽然实验验证仍然是金标准，但计算机模拟评估对于快速开发和比较机器学习模型至关重要。然而，尽管最先进的模型在当前评估指标上表现卓越，但它们在实际设计应用中的成功率仍然相对有限。例如，有研究报告显示生成结构的实验成功率仅为3%，而计算机模拟评分却远高于
在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
TensorFlow GPU 2.10.1 for Python 3.9快速安装指南疑样
本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
进阶向:基于Python的智能客服系统设计与实现
智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
机器学习专栏（62）：手把手实现工业级ResNet-34及调优全攻略
目录一、ResNet革命性突破解析1.1残差学习核心思想1.2ResNet-34结构详解二、工业级Keras实现详解2.1数据预处理流水线2.2完整模型实现三、模型训练调优策略3.1学习率动态调整3.2混合精度训练四、性能优化技巧4.1分布式训练配置4.2TensorRT推理加速五、实战应用案例5.1医疗影像分类5.2工业质检系统六、模型可视化分析6.1特征热力图6.2参数量分析七、常见问题解决方
模式识别与机器学习课程笔记（1）：数学基础 Ro Jace 学习笔记机器学习笔记人工智能
模式识别与机器学习课程笔记（1）：数学基础特征矢量和特征空间随机矢量的描述随机矢量的分布函数随机矢量的数字特征随机变量、随机矢量间的统计关系随机矢量的变换正态分布正态分布的定义正态分布随机矢量的性质离散随机矢量及其分布信息论矩阵微分法基本知识矢量或矩阵对于数量变量的微分二、数量函数对于矢量的微分三、矢量函数对于矢量的微分特征矢量和特征空间特征量的类型：物理量、次序量、名义量物理量：直接反映特征的实
6+，基于免疫原性细胞死亡的非肿瘤分型文章，投稿到接收仅一个多月，肿瘤的热点已经传导至非肿瘤生信文章中！生信小课堂
影响因子：6.147本文从投稿到接收仅一个多月关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，热点基因集，机器学习，分子分型等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析目前非肿瘤生信发文的门槛较低，有需要的朋友欢迎交流！研究概述：脑卒中是世界上死亡和残疾的主要原因之一，缺血性中风占80
VSCode使用Jupyter完整指南配置机器学习环境 z日火校招学习日记 vscode jupyter 机器学习
接下来开始机器学习部分第一步配置环境：VSCode使用Jupyter完整指南1.安装必要的扩展打开VSCode，按Ctrl+Shift+X打开扩展市场，搜索并安装以下扩展：必装扩展：Python(Microsoft官方)-Python语言支持Jupyter(Microsoft官方)-Jupyternotebook支持Pylance(Microsoft官方)-Python智能提示和语法检查推荐扩展：
养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
AI产品经理成长记《零号列车》第一集邂逅0XAI列车黑客思维者 AI产品经理养成人工智能 AI产品经理大模型智能体
《零号列车》绝非传统意义上的AI产品经理教程——它是我沉淀二十多年跨行业数字化转型与工业4.0实战经验后，首创的100集大型小说体培养指南。那些曾在千行百业验证过的知识与经验，不再是枯燥的文字堆砌，而是化作一场沉浸式的学习旅程。这里没有生硬的理论灌输，而是用跌宕起伏的故事情节，串联起AI技术的底层逻辑。你会跟着角色的脚步推进剧情，在不知不觉中吃透机器学习、大模型应用等专业概念；更有深入浅出的技术拆
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
Python领域制造业的Python应用 Python编程之道 Python编程之道 python 开发语言 ai
Python在制造业中的应用：从自动化到智能制造关键词：Python、制造业、工业自动化、数据分析、机器学习、物联网、智能制造摘要：本文深入探讨Python编程语言在制造业中的广泛应用。从基础的自动化脚本到复杂的智能制造系统，Python凭借其丰富的库生态系统和易用性，正在重塑现代制造业。我们将分析Python在制造业中的核心应用场景，包括设备监控、质量控制、预测性维护和供应链优化等，并通过实际案
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {