核密度估计是概率论上用来估计未知的密度函数,属于非参数检验,通过核密度估计图可以比较直观的看出样本数据本身的分布特征
#参数如下: sns.kdeplot(data,data2=None,shade=False,vertical=False,kernel='gau',bw='scott',gridsize=100,cut=3,clip=None,legend=True,cumulative=False,shade_lowest=True,cbar=False, cbar_ax=None, cbar_kws=None, ax=None, *kwargs)
主要用来绘制特征变量y值的分布,看看数据符合哪种分布
用的地方不多,了解为主,不需要深入研究
只有x一个参数
import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns sns.set() #切换到sns的默认运行配置 x=np.random.randn(100) plt.plot(x) #这样是无法看出分布 sns.kdeplot(x)
cumulative :是否绘制累积分布
#是否累计 sns.kdeplot(x,cumulative=True)
shade:若为True,则在kde曲线下面的区域中进行阴影处理,color控制曲线及阴影的颜色
#是否进行阴影处理 sns.kdeplot(x,shade=True,color="g")
vertical:表示以X轴进行绘制还是以Y轴进行绘制
#y轴画图 sns.kdeplot(x,vertical=True)
二元kde图像,很少使用,稍微了解一下即可
#x,y y=np.random.randn(100) sns.kdeplot(x,y) #cbar:参数若为True,则会添加一个颜色棒(颜色帮在二元kde图像中才有) sns.kdeplot(x,y,shade=True,cbar=True)
全部代码如下:
import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns sns.set() #切换到sns的默认运行配置 x=np.random.randn(100) plt.plot(x) #这样是无法看出分布 sns.kdeplot(x) #是否累计 sns.kdeplot(x,cumulative=True) #是否进行阴影处理 sns.kdeplot(x,shade=True,color="g") #y轴画图 sns.kdeplot(x,vertical=True) #x,y y=np.random.randn(100) sns.kdeplot(x,y) #cbar:参数若为True,则会添加一个颜色棒(颜色帮在二元kde图像中才有) sns.kdeplot(x,y,shade=True,cbar=True)