wamg潇潇

可视化库seaborn：swarmplot、tsplot、PairGrid 、violinplot、barplot、boxplot、palplot、`Facetgrid、catplot、heatmap

seaborn 库是对matplotlib库的封装。

1 布局&风格设置：set_style()

import seaborn as sns   # 导入模块
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
%matplotlib inline

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)  # 产生[0,14]上的100个点
    for i in range(1, 7):  # 画6条线
        plt.plot(x, np.sin(x + i * .5) * (7 - i) * flip) 
sinplot()

sns.set()使用seaborn默认的参数/风格组合；seaborn 的5种主题风格如下：

darkgrid 、    whitegrid   、    dark、    white、    ticks

sns.set_style("whitegrid")  # 风格设置 为白色格子
data = np.random.normal(size=(20, 6)) + np.arange(6) / 2
sns.boxplot(data=data)  # 盒图/箱线图

常用的绘图方法

sns.set_style("dark") 背景为深色，没有刻度线
sns.set_style("ticks") # 加刻度线
sns.despine() # 指定其它参数，去掉上方和右边的线段
sns.despine(left=True) # 隐藏左边的轴

四种布局设置 set_context(）

`sns.set_context("paper") ` 
sns.set_context("talk")
sns.set_context("poster")
sns.set_context("notebook", font_scale=1.5, rc={"lines.linewidth": 2.5})  # font_scale字体的大小

tsplot：时间线图表

参数
data	作图的数据
err_style	误差数据风格，可选：ci_band, ci_bars, boot_traces, boot_kde, unit_traces, unit_points
interpolate	bool，是否显示连线
ci	误差区间
n_boot	迭代次数

%matplotlib inline
import numpy as np
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt
np.random.seed(22)

#不发出警告
import warnings
warnings.filterwarnings('ignore')

x = np.linspace(0, 15, 31)
data = np.sin(x) + np.random.rand(10, 31) + np.random.randn(10, 1)
ax = sns.tsplot(data = data,
           err_style='ci_band', #误差数据风格，可选：ci_band, ci_bars, boot_traces,
           #boot_kde, unit_traces, unit_points
           interpolate = True,  #设置连线
           ci = [40, 70, 90],   #设置误差区间
           color = 'b'          #设置颜色
           )

gammas = sns.load_dataset("gammas")
gammas.head(3)
ax = sns.tsplot(time = 'timepoint',    #时间数据， x轴
           value = 'BOLD signal', #y轴value
           unit = 'subject',      #拆分，默认参数
           condition = 'ROI',     #分类
           data = gammas
           )

with sns.axes_style("darkgrid"):  
    plt.subplot(2,1,1)
    sns.tsplot(data=data, err_style="ci_bars", interpolate=False)
plt.subplot(2,1,2)
sns.tsplot(data=data, estimator=np.median)

with sns.axes_style("darkgrid"):  
    plt.subplot(2,1,1)
    sns.tsplot(data=data, err_style="boot_traces", n_boot=500)
plt.subplot(2,1,2)
sns.tsplot(data=data, err_style="unit_traces")

stripplot()：散点图

按照不同类别对样本数据进行分布散点图绘制;通过hue参数再分类; palette 设置调色盘

sns.stripplot(x="sex", y="total_bill", hue="day",
              data=tips, jitter=True,
              palette="Set2",  # 设置调色盘
              dodge=True,  # 是否拆分
             )
sns.stripplot(x="day", y="total_bill", data=tips,jitter = True, 
              order = ['Sat','Sun'])
# order → 筛选类别

画小提琴图

#f, ax = plt.subplots()
sns.violinplot(data)   # 小提琴图
sns.despine(offset=10)   # offset 指定图形离轴线的距离

sinplot

为子图设置不同的风格：用with域

with sns.axes_style("darkgrid"):  
    plt.subplot(211)
    sinplot()
plt.subplot(212)
sinplot(-1)

2 调色板

可视化图的颜色很重要！

color_palette()能传入任何Matplotlib所支持的颜色；不写参数则默认颜色
set_palette()设置所有图的颜色
6个默认的颜色循环主题：deep, muted, pastel, bright, dark, colorblind

sns.set(rc={"figure.figsize": (6, 6)})
current_palette = sns.color_palette()
sns.palplot(current_palette)

圆形画板

当分类的类别数大于6时，最简单的方法就是在一个圆形的颜色空间中画出均匀间隔的颜色(这样的色调会保持亮度和饱和度不变)。这是大多数的当他们需要使用比当前默认颜色循环中设置的颜色更多时的默认方案。最常用的方法是使用hls的颜色空间，这是RGB值的一个简单转换。

画8种渐变色的盒图

data = np.random.normal(size=(20, 8)) + np.arange(8) / 2
sns.boxplot(data=data,palette=sns.color_palette("hls", 8))  # 8种颜色

hls_palette()函数来控制颜色的亮度和饱和度

l-亮度 lightness
s-饱和 saturation
sns.palplot(sns.hls_palette(8, l=.5, s=.8))

Paired可以让相近的两个颜色成对显示

palplot

sns.palplot(sns.color_palette("Paired",8))

使用xkcd颜色来命名颜色

xkcd包含了一套针对随机RGB色的命名。产生了954个可以随时通过xdcd_rgb字典中调用的命名颜色。需要提前了解可以调用的颜色。 xkcd 包的两种调用方式如下：

plt.plot([0, 1], [0, 3], sns.xkcd_rgb["denim blue"], lw=3)
colors = ["windows blue", "amber", "greyish", "faded green", "dusty purple"]  
sns.palplot(sns.xkcd_palette(colors))

连续色板

色彩随数据变换，比如数据越来越重要则颜色由浅到深?需要传入一种颜色。
颜色_r则由深到浅

sns.palplot(sns.color_palette("Blues"))  # 蓝色：由浅到深
sns.palplot(sns.color_palette("BuGn_r"))  #绿色：由深到浅

cubehelix_palette() 调色板：色调线性变换

sns.palplot(sns.color_palette("cubehelix", 8))
sns.palplot(sns.cubehelix_palette(8, start=.5, rot=-.75))  # 8种颜色，指定颜色区间
sns.palplot(sns.cubehelix_palette(8, start=.75, rot=-.150))

light_palette() 和dark_palette()调用定制连续调色板，

reverse=True表示颜色由深到浅

sns.palplot(sns.light_palette("green"))
sns.palplot(sns.light_palette("navy", reverse=True))
sns.palplot(sns.light_palette((210, 90, 60), input="husl"))

x, y = np.random.multivariate_normal([0, 0], [[1, -.5], [-.5, 1]], size=300).T
pal = sns.dark_palette("green", as_cmap=True)  # 里层为浅色，外层为深色的颜色渐变
sns.kdeplot(x, y, cmap=pal);

单变量分析

%matplotlib inline
import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt

import seaborn as sns
sns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))

x = np.random.normal(size=100)  #  x 为要绘制的数据；distplot绘制直方图；bins为直方区间的数目
sns.distplot(x, bins=20, kde=False)  # kde核密度估计，为False表示不添加核密度曲线

数据分布情况

distplot直方图()

x = np.random.gamma(6, size=200)  # 产生200个服从伽马分布的数据
sns.distplot(x, kde=False, fit=stats.gamma)

根据均值和协方差生成数据

mean, cov = [0, 1], [(1, .5), (.5, 1)] 
data = np.random.multivariate_normal(mean, cov, 200)  # 产生多维正态分布的随机数
df = pd.DataFrame(data, columns=["x", "y"])   # 数据框
df

`.jointplot()` 画散点图

反映特征之间的相关关系，还会显示皮尔逊相关系数；观测两个变量之间的分布关系最好用散点图

 sns.jointplot(x="x", y="y", data=df);

hex图：当数据点的数目过多时，颜色越深表示点越密集

x, y = np.random.multivariate_normal(mean, cov, 1000).T   # hex图，数据点为六角形
with sns.axes_style("white"): # 风格为黑白相间
    sns.jointplot(x=x, y=y, kind="hex", color="k")

回归分析

regplot()和lmplot()都可以绘制回归关系,入门推荐regplot() ；lmplot()功能和规范更多。

import seaborn as sns
sns.set(color_codes=True)

np.random.seed(sum(map(ord, "regression")))
tips = sns.load_dataset("tips")
tips.head()
sns.regplot(x="total_bill", y="tip", data=tips)
sns.lmplot(x="total_bill", y="tip", data=tips)
sns.regplot(x="size", y="tip", data=tips, x_jitter=.05)  # jitter 给数据加上扰动，扰动范围可自行指定

类别值的可视化展示

stripplot

import seaborn as sns
sns.set(style="whitegrid", color_codes=True)

np.random.seed(sum(map(ord, "categorical")))
sns.stripplot(x="day", y="total_bill", data=tips);  # 重叠影响数据的观察
sns.stripplot(x="day", y="total_bill", data=tips, jitter=True) # jitter=True 使数据左右偏移

swarmplot：用于分簇散点图，避免点的重叠

sns.swarmplot(x="day", y="total_bill", data=tips)的可视化结果更像茎叶图
hue 指定划分数据的那个统计特征。调换x 和y的列名，则图像就由横向变为纵向。

sns.swarmplot(x="day", y="total_bill", hue="sex",data=tips)
sns.swarmplot(x="total_bill", y="day", hue="time", data=tips);  # 调换x 和y的列名；横着画图

小提琴图 violinplot

sns.violinplot(x="day", y="total_bill", data=tips,
            linewidth = 2,   # 线宽
            width = 0.8,     # 箱之间的间隔比例
            palette = 'hls', # 设置调色板
            order = ['Thur','Fri','Sat','Sun'],  # 筛选类别
            scale = 'area',  # 测度小提琴图的宽度：area-面积相同，count-按照样本数量决定宽度，width-宽度一样
            gridsize = 50,   # 设置小提琴图边线的平滑度，越高越平滑
            inner = 'box',   # 设置内部显示类型 → “box”, “quartile”, “point”, “stick”, None
            #bw = 0.8        # 控制拟合程度，一般可以不设置
           )

sns.violinplot(x="day", y="total_bill", hue="sex", data=tips, split=True);  # split=True表示在小提琴图的左右两边各指定属性sex的一个值

中间的黑色粗线为4分位距，细线为 95% 置信区间。

sns.violinplot(x="day", y="total_bill", data=tips, inner=None)  # inner 小提琴内部图形
sns.swarmplot(x="day", y="total_bill", data=tips, color="w", alpha=.5)  # alpha 透明度   # 插入散点图
plt.show()
sns.violinplot(x="day", y="total_bill", data=tips, inner=None)
sns.swarmplot(x="day", y="total_bill", data=tips, color="w",)
plt.show()

条形图barplot：显示数据的集中趋势

又叫柱状图，直方图；置信区间估计【置信区间：样本均值 + 抽样误差】

sns.barplot(x="sex", y="survived", hue="class", data=titanic,
            palette = 'hls', 
            order = ['male','female'],  # 筛选类别
            capsize = 0.05,  # 误差线横向延伸宽度
            saturation=.8,   # 颜色饱和度
            errcolor = 'gray',errwidth = 2,  # 误差线颜色，宽度
            ci = 'sd'    # 置信区间误差 → 0-100内值、'sd'、None
            )

sns.barplot(x="sex", y="survived", hue="class", data=titanic); 显示泰坦尼克数据集上不同船舱等级【class】的男性与女性的存活率；

# 柱状图 - 置信区间估计  
sns.barplot(x="day", y="total_bill", hue="sex", data=tips,
            palette = 'Blues',edgecolor = 'w')
tips.groupby(['day','sex']).mean()       # 计算数据

crashes = sns.load_dataset("car_crashes").sort_values("total", ascending=False)    # 加载数据
f, ax = plt.subplots(figsize=(6, 15))    # 创建图表
sns.set_color_codes("pastel")          # 设置第一个柱状图
sns.barplot(x="total", y="abbrev", data=crashes,
            label="Total", color="b",edgecolor = 'w')
sns.set_color_codes("muted")      # 设置第二个柱状图
sns.barplot(x="alcohol", y="abbrev", data=crashes,
            label="Alcohol-involved", color="b",edgecolor = 'w')
ax.legend(ncol=2, loc="lower right")
sns.despine(left=True, bottom=True)

lvplot（） LV图表

sns.lvplot(x="day", y="total_bill", data=tips, palette="mako",
           #hue = 'smoker',
           width = 0.8,           # 箱之间间隔比例
           linewidth = 12,
           scale = 'area',        # 设置框的大小 → “linear”、“exonential”、“area”
           k_depth = 'proportion',  # 设置框的数量 → “proportion”、“tukey”、“trustworthy”
          )# 绘制LV图

sns.swarmplot(x="day", y="total_bill", data=tips,color ='k',size = 3,alpha = 0.8)     # 可以添加散点图

countplot（）计数柱状图

sns.countplot(x="class", hue="who", data=titanic,palette = 'magma')
#sns.countplot(y="class", hue="who", data=titanic,palette = 'magma')  
# x/y → 以x或者y轴绘图（横向，竖向）
# 用法和barplot相似

pointplot折线图：更好地描述变化差异

sns.pointplot(x="sex", y="survived", hue="class", data=titanic);显示泰坦尼克数据集上不同船舱等级【class】的男性与女性的存活率的差距；

sns.pointplot(x="time", y="total_bill", hue = 'smoker',data=tips, 
              palette = 'hls',                # # 用法和barplot相似
              dodge = True,   # 设置点是否分开
              join = True,    # 是否连线
              markers=["o", "x"], linestyles=["-", "--"],  # 设置点样式、线型
              )
tips.groupby(['time','smoker']).mean()['total_bill']         # 计算数据

sns.pointplot(x="class", y="survived", hue="sex", data=titanic, 
              palette={"male": "g", "female": "m"},  # 颜色
              markers=["^", "o"], linestyles=["-", "--"]);  # 数据点标记为三角、圆圈，

盒图boxplot ：显示数据的五数概括

怎样衡量离群点与正常值的差异，这取决于数据的特征。
盒图又叫箱型图、箱线图；五数概括法即用下面的五个数来概括数据：

最小值min；     第1四分位数(Q1)；     中位数(Q2)；     第3四分位数(Q3)；     最大值max

IQR即统计学中的四分位距，第一/四分位Ｑ1与第三/四分位Q3之间的距离
一般可认为N = 1.5IQR 如果一个值大于Q3+N或 小于Ｑ1-N,则为离群点。

sns.boxplot(x="day", y="total_bill", data=tips,
            linewidth = 2,   # 线宽
            width = 0.8,     # 箱之间的间隔比例
            fliersize = 3,   # 异常点大小
            palette = 'hls', # 设置调色板
            whis = 1.5,      # 设置IQR 
            notch = True,    # 设置是否以中值做凹槽
            order = ['Thur','Fri','Sat','Sun'],  # 筛选类别
           )  # 绘制箱型图  
sns.swarmplot(x="day", y="total_bill", data=tips,color ='k',size = 3,alpha = 0.8) # 可以添加散点图

sns.boxplot(data=iris,orient="h");  # orient="h" 表示图形要横着放

factorplot ：多层面板分类图

seaborn.factorplot(x=None, y=None, hue=None, data=None, row=None, col=None, col_wrap=None, estimator=, ci=95, 
					n_boot=1000, units=None, order=None, hue_order=None, row_order=None, col_order=None, 
					kind='point', size=4, aspect=1, orient=None, color=None, palette=None, legend=True, legend_out=True, 
					sharex=True, sharey=True, margin_titles=False, facet_kws=None, **kwargs)

Parameters：

x,y,hue  数据集变量 ;变量名     hue 是分组指标
data 数据集; 数据集名
row,col 更多分类变量进行平铺显示; 变量名
col_wrap 每行的最高平铺数; 整数
estimator 在每个分类中进行矢量到标量的映射 ;矢量
ci 置信区间; 浮点数或None
n_boot 计算置信区间时使用的引导迭代次数 ;整数
units 采样单元的标识符，用于执行多级引导和重复测量设计; 数据变量或向量数据
order, hue_order 对应排序列表 ;字符串列表
row_order, col_order 对应排序列表 ;字符串列表
kind : 可选：point 默认为点图, bar 柱形图, count 频次, box 箱体, violin 提琴, strip 散点，swarm 分散点
size 每个面的高度（英寸）； 标量 
aspect 纵横比 ；标量 
orient 方向 "v"/"h"
 color 颜色 matplotlib颜色 palette 调色板 seaborn颜色色板或字典
  legend hue的信息面板 True/False
  legend_out 是否扩展图形，并将信息框绘制在中心右边 True/False 
  share{x,y} 共享轴线 True/False

示例：

sns.factorplot(x="day", y="total_bill", hue="smoker", data=tips, kind="bar")  # 条形图
sns.factorplot(x="day", y="total_bill", hue="smoker",
               col="time", data=tips, kind="swarm")      # kind="swarm" 树形图
sns.factorplot(x="time", y="total_bill", hue="smoker",
               col="day", data=tips, kind="box", size=4, aspect=.5)  # kind="box"盒图

catplot

参数解释

data	DataFrame类型，其中每一列都是一个变量（特征），每一行都是一个样本
x, y, hue	data中的变量名
row, col, hue	strings；定义数据子集的变量
col_wrap	int；限制网格中图的列的个数； col_wrap =3则画布里最多只能画3列
estimator	可调用的将向量映射为标量的统计函数，estimate within each categorical bin
ci	float or “sd” or None 估计值的置信区间的大小；为sd时表示忽 bootstrapping，求观察值的标准差；为 None, n则不执行bootstrapping，不在图上加误差棒error bars
n_boot	int；在计算置信区间时bootstrap的迭代次数
units	data 中的变量名or 向量数据
order, hue_order	lists of strings；类别顺序
row_order, col_order	lists of strings；指定作图的行/列排序
kind	string，图的类型；可选的有“point”, “bar”, “strip”, “swarm”, “box”, “violin”, “boxen”.
height	scalar；每个图片的高度设定，默认为3
aspect	纵横比；每个小图的横轴长度和纵轴的比；默认为1，即等高等宽
orient	“v” , “h”,图的放置方向 (vertical or horizontal).
color	matplotlib color
palette	调色板； list或dict, 可选的颜色有deep, muted, bright, pastel, dark, colorblind
legend	bool；legend是图例；True时将hue variable的图例加到图上
legend_out	bool；默认为True，图形尺寸将被扩展，并且图例将被绘制在中心右侧的图形之外
share{x,y}	bool, ‘col’, or ‘row’ ；是否共享x轴或者y轴；默认是都共享True
margin_titles	bool；为True时，最后一列的右边会有行变量的标题
facet_kws	dict；传递给FacetGrid的关键字参数
kwargs	键值对【key, value pairings】，传给绘图函数的其它关键字参数
jitter	控制抖动的大小; jitter=False 表示不对数据进行扰动

sns.catplot(x="smoker", y="tip", order=["No", "Yes"], data=tips); ` 使用order参数在特定图表的基础上控制排序

sns.catplot(x="day", y="total_bill", hue="smoker", kind="box", data=tips);添加色调变量hue

显示与facet的多种关系

sns.catplot(x="day", y="total_bill", hue="smoker",
            col="time", aspect=.6,
            kind="swarm", data=tips);

boxenplot() ：优化版的箱线图

函数boxenplot() 、参数kind=”boxen”绘制的图表类似于箱形图，但已经过优化，可显示有关分布形状的更多信息。它最适合更大的数据集。

sns.catplot(x="color", y="price", kind="boxen",
            data=diamonds.sort_values("color"));

Facetgrid

先指定属性col ,构造要可视化的区域，再用map函数作图；要求数据格式为pandas中的格式。
在大多数情况下，使用图形级别功能（如relplot()或catplot()）比 FacetGrid直接使用更好。

class seaborn.FacetGrid(data, row=None, col=None, hue=None, col_wrap=None, sharex=True, sharey=True, 
						height=3, aspect=1, palette=None, row_order=None, col_order=None, hue_order=None, 
						hue_kws=None, dropna=True, legend_out=True, despine=True, margin_titles=False, xlim=None, 
						ylim=None, subplot_kws=None, gridspec_kws=None, size=None)

参数解释

data	DataFrame类型，其中每一列都是一个变量（特征），每一行都是一个样本
row, col, hue	strings；定义数据子集的变量
col_wrap	int；限制网格中图的列的个数； col_wrap =3则画布里最多只能画3列
orient	“v” , “h”,图的放置方向 (vertical or horizontal).
share{x,y}	bool, ‘col’, or ‘row’ ；是否共享x轴或者y轴；默认是都共享True
height	scalar；每个图片的高度设定，默认为3
aspect	纵横比；每个小图的横轴长度和纵轴的比；默认为1，即等高等宽
palette	list或dict, 可选的颜色有deep, muted, bright, pastel, dark, colorblind
{row,col,hue}_order	lists；指定排序；默认是数据中显示的级别，如果变量是pandas分类，则是类别顺序。
hue_kws	dictionary of param -> list of values mapping；hue_kwss增加快速辨识，在变量很多时很有用
legend_out	bool；legend是图例；默认为True，图形尺寸将被扩展，并且图例将被绘制在中心右侧的图形之外
despine	boolean；从图中移除顶部和右侧边框, 边缘框架
margin_titles	bool；为True时，最后一列的右边会有行变量的标题
{x, y}lim	tuples；每条轴的数值区间
subplot_kws	dict,传递给matplotlib的subplot(s) 方法的关键字参数字典 ;可参考subplot函数的参数
gridspec_kws	dict, 传递给matplotlib的gridspec模块的关键字参数的字典

g = sns.FacetGrid(tips, col="sex", hue="time", palette=pal,hue_order=["Dinner", "Lunch"], 
hue_kws=dict(marker=["^", "v"])) # 给颜色语意使用不同的标签，这样可以进行一部分区别
g = (g.map(plt.scatter, "total_bill", "tip", **kws).add_legend())

tips = sns.load_dataset("tips")
g = sns.FacetGrid(tips, col="time")  # 这一步只显示作图区域
g.map(plt.hist, "tip");

g = sns.FacetGrid(tips, col="sex", hue="smoker")  
g.map(plt.scatter, "total_bill", "tip", alpha=.7)  # 散点图 ；alpha 为散点图的透明度，值越小越透明
g.add_legend();   # 添加类别注释/ 图例

g = sns.FacetGrid(tips, row="smoker", col="time", margin_titles=True) 
g.map(sns.regplot, "size", "total_bill", color=".1", fit_reg=False, x_jitter=.1);  # fit_reg 是否添加回归线 ；color颜色深浅

整体布局的设置

g = sns.FacetGrid(tips, col="day", size=4, aspect=.5)  #  size 图像大小；aspect设置图的长宽比
g.map(sns.barplot, "sex", "total_bill");

指定画图的顺序

自行指定顺序，则要用pandas中的Categorical ，

from pandas import Categorical
ordered_days = Categorical(['Thur', 'Fri', 'Sat', 'Sun'])  # 指定顺序
g = sns.FacetGrid(tips, row="day", row_order=ordered_days,
                  size=1.7, aspect=4,)
g.map(sns.boxplot, "total_bill");

用字典dict为不同类别指定颜色

pal = dict(Lunch="seagreen", Dinner="gray") # 用字典dict 指定颜色
g = sns.FacetGrid(tips, hue="time", palette=pal, size=5) # palette 指定调色板
g.map(plt.scatter, "total_bill", "tip", s=50, alpha=.7, linewidth=.5, edgecolor="white") # edgecolor边界颜色  ；s是数据点圆圈的大小
g.add_legend();

marker 指定数据点的形状

g = sns.FacetGrid(tips, hue="sex", palette="Set1", size=5, hue_kws={"marker": ["^", "v"]})  # marker 数据点的形状
g.map(plt.scatter, "total_bill", "tip", s=100, linewidth=.5, edgecolor="white")
g.add_legend();

绘制子图

with sns.axes_style("white"):  # 用with；  axes_style设置风格
    g = sns.FacetGrid(tips, row="sex", col="smoker", margin_titles=True, size=2.5)
g.map(plt.scatter, "total_bill", "tip", color="#334488", edgecolor="white", lw=.5);
g.set_axis_labels("Total bill (US Dollars)", "Tip"); # 显示x轴、y轴的名称
g.set(xticks=[10, 30, 50], yticks=[2, 6, 10]); # xticks 显示X轴上的刻度值；用set设置刻度
g.fig.subplots_adjust(wspace=.02, hspace=.02);  # 设置子图的间距；
#g.fig.subplots_adjust(left  = 0.125,right = 0.5,bottom = 0.1,top = 0.9, wspace=.02, hspace=.02)  # 调偏移程度

PairGrid ：画对图

heatmap :热力图、热度图

heatmap用颜色的深浅、亮度等来显示数据的分布，还常用于可视化特征间的相关系数。用颜色深浅来反映相关程度。

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np; 
np.random.seed(0)
import seaborn as sns;
sns.set()

uniform_data = np.random.rand(3, 3)
print (uniform_data) 
heatmap = sns.heatmap(uniform_data)   # 最右边的是color bar

vmaxax = sns.heatmap(uniform_data, vmin=0.2, vmax=0.5) 取值低于vmin的是一种颜色，高于vmax的是另一种颜色，

center=0指定中心值，大于或小于零的值对应的颜色不一样。

normal_data = np.random.randn(3, 3)  
print (normal_data)                      
ax = sns.heatmap(normal_data, center=0)   #  例如股票数据的收益率大于0表示涨，小于零表示跌

heatmap参数注释
annot	bool ;为True表示增加注释，把值加到对应位置去
fmt	数值的格式，fmt默认为科学计数法，作图容易乱码
cmap	可调用的调色板
linewidths	格子的间距，更容易清晰地看出数值的差距
cbar	color bar , 取False则不显示cbar

flights = sns.load_dataset("flights")         
flights = flights.pivot("month", "year", "passengers")  # pivot数据透视表， 
# ax = sns.heatmap(flights)     # fmt="d"表示数值的格式，#cmap 指定数据值到颜色空间的映射;
ax = sns.heatmap(flights, annot=True,fmt="d", cmap="YlGnBu",linewidths=.5, cbar=True)

绘制半边热图

#设置风格
sns.set(style = 'white')
#创建数据
rs = np.random.RandomState(33)
d = pd.DataFrame(rs.normal(size = (100, 26)))
corr = d.corr()  #求解相关性矩阵表格
mask = np.zeros_like(corr, dtype = np.bool)     #设置一个‘上三角形’蒙版
mask[np.triu_indices_from(mask)] = True
#设置调色盘
cmap = sns.diverging_palette(220, 10, as_cmap = True)
#生成半边热图
sns.heatmap(corr, mask = mask, cmap = cmap, vmax = .3, center = 0,
            square = True, linewidths = 0.2)

多变量的分布绘图：stripplot()、swarmplot()；箱线图与小提琴图；条形图；点图；多层面板分类图：catplot函数、FacetGrid 类、PairGrid类；热力图

seaborn教程——用分类数据绘图

Seaborn学习（一）------- 构建结构化多绘图网格（FacetGrid(）、map()）详解

你可能感兴趣的:(python机器学习)

Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
Python自动化办公2.0 即将发布百里图书自动化人工智能 python
第一节课：数据整理与清洗第二节课：数据筛选、过滤与排序第三节课：高级数据处理技巧第四节课：数据可视化与实践案例第五节课：统计分析与报表第六节：常见的Excel报表与下方的课程形成知识体系：Python自动化办公(面向2020,Python3.7,不断更新ing)_在线视频教程-CSDN程序员研修院https://edu.csdn.net/course/detail/28031Python机器学习教
【Python机器学习】循环神经网络（RNN）——传递数据并训练 zhangbin_237 Python机器学习机器学习 python rnn 人工智能开发语言深度学习神经网络
与其他Keras模型一样，我们需要向.fit()方法传递数据，并告诉它我们希望训练多少个训练周期（epoch）：model.fit(X_train,y_train,batch_size=batch_size,epochs=epochs,validation_data=(X_test,y_test))因为个人小电脑内存不足，所以吧maxlen参数改成了100重新运行。保存模型：model_struc
【Python机器学习】循环神经网络（RNN）——对RNN进行预测 zhangbin_237 Python机器学习机器学习 python rnn 深度学习人工智能自然语言处理
目录有状态性双向RNN编码向量如果有一个经过训练的模型，接下来就可以对其进行预测：sample_1="""Ihatethatthedismalweatherhadmedownforsolong,whenwillitbreak!Ugh,whendoeshappinessreturn?Thesunisblindingandthepuffycloudsaretoothin.Ican'twaitforth
Python 机器学习基础之数据表示与特征工程【分箱、离散化、线性模型与树 / 交互特征与多项式特征】的简单说明仙魁XAN Python 机器学习基础+实战案例机器学习 python 分箱离散化线性模型与树交互特征与多项式特征
Python机器学习基础之数据表示与特征工程【分箱、离散化、线性模型与树/交互特征与多项式特征】的简单说明目录Python机器学习基础之数据表示与特征工程【分箱、离散化、线性模型与树/交互特征与多项式特征】的简单说明一、简单介绍二、分箱、离散化、线性模型与树三、交互特征与多项式特征附录一、参考文献一、简单介绍Python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言，最初被设计用于
【Python机器学习】机器学习任务中常见的数据异质问题和模型异构问题是什么？解决策略是什么？惊鸿若梦一书生 Python机器学习 python 深度学习开发语言
文章目录数据异质模型异构数据异质数据异质问题（Heterogeneityindata）通常指数据集内部的不一致性，这些不一致性可能来自多种源。在实际应用中，数据异质性可以表现为多种形式，包括：不同来源的数据：数据可能来自不同的数据源，每个源可能采用不同的数据收集方法和标准。例如，社交媒体数据和传统调查数据就可能有很大的差异。不同类型的数据：数据可以是结构化的（例如，数据库中的表格数据），半结构化的
【Python机器学习】卷积神经网络（CNN）的工具包 zhangbin_237 Python机器学习机器学习 python cnn 神经网络自然语言处理开发语言
Python是神经网络工具包最丰富的语言之一。两个主要的神经网络架构分别是Theano和TensorFlow。这两者的底层计算深度依赖C语言，不过它们都提供了强大的PythonAPI。Torch在Python里面也有一个对应的API是PyTorch。这些框架都是高度抽象的工具集，适用于从头构建模型。Python社区开发了一些第三方库来简化这些底层架构的使用。其中Keras在API的友好性和功能性方
【Python机器学习】卷积神经网络（CNN） zhangbin_237 Python机器学习机器学习 python cnn 开发语言自然语言处理
卷积神经网络（CNN）得名于在数据样本上用滑动窗口（或卷积）的概念。卷积在数学中应用很广泛，通常与时间序列数据相关。它是用一个可视化盒子在一个区域内滑动，如下图所示：构建块卷积神经网络最早出现在图像处理和图像识别领域，它能够捕捉每个样本中数据点之间的空间关系，也就能识别出图像中是猫还是狗。卷积网络，也称为convnet，不像传统的前馈网络那样对每个元素（图中的像素）分配权重，而是定义了一组在图像上
python机器学习算法--贝叶斯算法在下小天n 机器学习 python 机器学习算法
1.贝叶斯定理在20世纪60年代初就引入到文字信息检索中，仍然是文字分类的一种热门（基准）方法。文字分类是以词频为特征判断文件所属类型或其他（如垃圾邮件、合法性、新闻分类等）的问题。原理牵涉到概率论的问题，不在详细说明。sklearn.naive_bayes.GaussianNB(priors=None,var_smoothing=1e-09)#Bayes函数·priors：矩阵，shape=[n
【Rust】——采用发布配置自定义构建 Y小夜 Rust（官方文档重点总结）rust 开发语言后端
博主现有专栏：C51单片机（STC89C516），c语言，c++，离散数学，算法设计与分析，数据结构，Python，Java基础，MySQL，linux，基于HTML5的网页设计及应用，Rust（官方文档重点总结），jQuery，前端vue.js，Javaweb开发，Python机器学习等主页链接：Y小夜-CSDN博客今日学习推荐：在当今这个飞速发展的信息时代，人工智能（AI）已经成为了一个不可或
【Rust】——高级类型 Y小夜 Rust（官方文档重点总结）rust 开发语言后端
博主现有专栏：C51单片机（STC89C516），c语言，c++，离散数学，算法设计与分析，数据结构，Python，Java基础，MySQL，linux，基于HTML5的网页设计及应用，Rust（官方文档重点总结），jQuery，前端vue.js，Javaweb开发，Python机器学习等主页链接：Y小夜-CSDN博客目录为了类型安全和抽象而使用的newtype模式类型别名用来创建类型同义词不返回
【Python机器学习】NLP词频背后的含义——隐性语义分析 zhangbin_237 Python机器学习 python 机器学习自然语言处理人工智能开发语言
隐性语义分析基于最古老和最常用的降维技术——奇异值分解（SVD）。SVD将一个矩阵分解成3个方阵，其中一个是对角矩阵。SVD的一个应用是求逆矩阵。一个矩阵可以分解成3个最简单的方阵，然后对这些方阵求转置后再把它们相乘，就得到了原始矩阵的逆矩阵。它为我们提供了一个对大型复杂矩阵求逆的捷径。SVD适用于桁架结构的应力和应变分析等机械工程问题，它对电气工程中的电路分析也很有用，它甚至在数据科学中被用于基
【Python机器学习】NLP分词——利用分词器构建词汇表（三）——度量词袋之间的重合度 zhangbin_237 Python机器学习机器学习自然语言处理人工智能 python 开发语言
如果能够度量两个向量词袋之间的重合度，就可以很好地估计他们所用词的相似程度，而这也是它们语义上重合度的一个很好的估计。因此，下面用点积来估计一些新句子和原始的Jefferson句子之间的词袋向量重合度：importpandasaspdsentence="""ThomasJeffersonBeganbulidingMonticelliastheageof26.\n"""sentence=senten
【Python机器学习】NLP概述——深度处理 zhangbin_237 Python机器学习 python 机器学习自然语言处理人工智能机器人
自然语言处理流水线的各个阶段可以看作是层，就像是前馈神经网络中的层一样。深度学习就是通过在传统的两层机器学习模型架构（特征提取+建模）中添加额外的处理层来创建更复杂的模型和行为。上图中，前四层对应于聊天机器人流水线中的前两个阶段（特征提取和特征分析）。例如，词性标注（POS标注）是在聊天机器人流水线的分析阶段生成特征的一种方法。POS标签由默认的SpaCY流水线自动生成，该流水线包括上图中所有的前
【Python机器学习】NLP分词——词干还原的挑战 zhangbin_237 Python机器学习自然语言处理人工智能机器学习 python 开发语言
要想使用自然语言处理的相关应用，第一件事就是需要一个强大的词汇表。我们要把文档或任何字符串拆分为离散的有意义的词条，这里说的词条仅限于词、标点符号和数值，但是这里使用的技术可以很容易推广到字符序列包含的任何其他有意义的单元，比如ASCII表情符号、Unicode表情符号和数学符号。从文档中检索词条需要一些字符串处理方法，这些方法不仅仅是str.split()，处理时需要把标点符号与词分开，还需要将
【Python机器学习】NLP概述——自然语言智商 zhangbin_237 Python机器学习机器学习自然语言处理人工智能 python 机器人
就像人类的智能一样，如果不考虑多个智能维度，单凭一个智商分数是无法轻易衡量NLP流水线的能力的。衡量机器人系统能力的一种常见方法是：根据系统行为的复杂性和所需的人类监督成都这两个维度来衡量。但是对自然语言处理流水线而言，其目标是建立一个完全自动化的自然语言处理系统，会消除所有的人工监督（一旦模型被训练和部署）。因此，一对更好的IQ维度应该能捕捉到自然语言流水线复杂的广度和深度。像Alexa或All
【Python机器学习】NLP概述——聊天机器人的自然语言流水线 zhangbin_237 Python机器学习自然语言处理机器人人工智能 python 机器学习
构建对话引擎或者聊天机器人所需的NLP流水线类似于某些问答系统。聊天机器人需要4个处理阶段和一个数据库来维护过去语句和回复的记录。这4个处理阶段中的每个阶段都可以包含一个或多个并行或串行工作的处理算法。如下图所示：1、解析：从自然语言文本中提取特征、结构化数值数；2、分析：通过对文本的情感、语法合法度及语义打分，生成和组合特征；3、生成：使用模板、搜索或语言模型生成可能的回复；4、执行：根据对话历
《Python机器学习项目实战》书籍介绍袁袁袁袁满 python 机器学习开发语言
文章目录书籍介绍主要内容书籍目录书籍介绍《Python机器学习项目实战》带领大家在构建实际项目的过程中，掌握关键的机器学习概念！使用机器学习，我们可完成客户行为分析、价格趋势预测、风险评估等任务。要想掌握机器学习，需要有优质的范例、清晰的讲解和大量的练习。《Python机器学习项目实战》完全满足这三点！《Python机器学习项目实战》展示了现实、实用的机器学习场景，并全面、清晰地介绍了机器学习的关
【Python机器学习】NLP的部分实际应用 zhangbin_237 Python机器学习机器学习自然语言处理人工智能 python 大数据
自然语言处理在现实中非常多的应用，下表是其中的一些例子：应用示例1示例2示例3搜索web文档自动补全编辑拼写语法风格对话聊天机器人助手行程安排写作索引用语索引目录电子邮件垃圾邮件过滤分类优先级排序文本挖掘摘要知识提取医学诊断法律法律断案先例搜索传票分类新闻事件检索真相核查标题排字归属剽窃检测文字取证风格指导情感分析团队士气监控产品评论分类客户关怀行为预测金融选举预测营销创作电影脚本诗歌歌词如果在索
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Python机器学习笔记：CART算法实战战争热诚
完整代码及其数据，请移步小编的GitHub传送门：请点击我如果点击有误：https://github.com/LeBron-Jian/MachineLearningNote前言在python机器学习笔记：深入学习决策树算法原理一文中我们提到了决策树里的ID3算法，C4.5算法，并且大概的了
python机器学习库Scikit-learn 崔吉龙
python语言中用来处理机器学习的库最重要的就是Scikit-learn，简称sklearn。被大多数科学家所钟爱，包括了构建良好的学习算法、误差函数和测试例程。在sklearn的核心有四种类型的类覆盖了所有机器学习功能：分类回归聚类分组转换数据虽然sklearn提供的算法比较多，但是他们都符合基本的接口定义，为了是使用不同的算法时，所使用的接口时统一的。sklearn提供了四个基本对象接口。评
optuna，一个好用的Python机器学习自动化超参数优化库牵着猫散步的鼠鼠 python 开发语言
️个人主页：鼠鼠我捏，要死了捏的主页️付费专栏：Python专栏️个人学习笔记，若有缺误，欢迎评论区指正前言超参数优化是机器学习中的重要问题，它涉及在训练模型时选择最优的超参数组合，以提高模型的性能和泛化能力。Optuna是一个用于自动化超参数优化的库，它提供了有效的参数搜索算法和方便的结果可视化工具。目录前言
【机器学习笔记】 6 机器学习库Scikit-learn RIKI_1 机器学习机器学习笔记 scikit-learn
Scikit-learn概述Scikit-learn是基于NumPy、SciPy和Matplotlib的开源Python机器学习包,它封装了一系列数据预处理、机器学习算法、模型选择等工具,是数据分析师首选的机器学习工具包。自2007年发布以来，scikit-learn已经成为Python重要的机器学习库了，scikit-learn简称sklearn，支持包括分类，回归，降维和聚类四大机器学习算法。
Python机器学习：Scikit-learn库与应用数据小爬虫 api 电商api 机器学习 python scikit-learn 开发语言运维服务器
当涉及到Python机器学习时，Scikit-learn是一个非常流行且功能强大的库。它提供了广泛的算法和工具，使得机器学习变得简单而高效。下面是一个简单的Scikit-learn库与应用示例，其中包括代码。首先，确保你已经安装了Scikit-learn库。你可以使用pip命令来安装它：bash复制代码pipinstallscikit-learn接下来，我们将使用Scikit-learn来执行一个
见世面的成本有多低？这几个技术公众号告诉你答案傅一平
独乐乐，不如众乐乐，为您精选以下公众号！人工智能爱好者社区专注人工智能、机器学习、数据科学等顶尖技术前沿科技成果研究、实战技巧。每周会有书豪采访记系列采访技术大佬文章和原创漫画文章，立即关注，掌握人工智能最新资讯与成果。号主是《R数据科学实战：工具详解与案例分析》书籍作者。大数据分析挖掘和Python机器学习商业智能BI、数据分析、数据挖掘、大数据、Python、机器学习、深度学习、算法等技术分享
如何安装Pytorch,CPU版本和GPU版本的安装流程。 JayGboy pytorch 人工智能 python
1.PyTorch简介：PyTorch是一个开源的Python机器学习框架，专注于深度学习任务。它由Facebook的人工智能研究团队开发并维护，提供了丰富的工具和库，用于构建和训练各种深度神经网络模型。PyTorch使用动态计算图的概念，允许用户在运行时动态地定义、修改和调试计算图。这种灵活性使得模型构建和调试更加直观和方便，同时也支持更复杂的模型结构和控制流程。PyTorch采用Pythoni
Python机器学习之交叉验证一只怂货小脑斧
交叉验证是一种非常常用的对于模型泛化能力进行评估方法，交叉验证既可以解决数据集的数据量不够大问题，也可以解决参数调优的问题。常用的交叉验证方法有：简单交叉验证（HoldOut检验，例如train_test_split）、k折交叉验证（例如KFold）、自助法kfold是将数据集划分为K-折，只是划分数据集；cross_val_score是根据模型进行计算，计算交叉验证的结果，你可以简单认为就是cr
浏览器F12调试知行合一。。。测试技术功能测试
系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录1浏览器F12开发者工具1.1F12开发者工具基本介绍1.2F12常规设置2标签页2.1Elements查看器2.2Network网络2.3Network抓包分析案例1：以登录百度账号
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

可视化库seaborn：swarmplot、tsplot、PairGrid 、violinplot、barplot、boxplot、palplot、`Facetgrid、catplot、heatmap

1 布局&风格设置：set_style()

常用的绘图方法

四种布局设置 set_context(）

tsplot：时间线图表

stripplot()： 散点图

画小提琴图

sinplot

为子图设置不同的风格：用with域

2 调色板

palplot

连续色板

cubehelix_palette() 调色板 ：色调线性变换

单变量分析

数据分布情况

distplot直方图()

.jointplot() 画散点图

hex图：当数据点的数目过多时，颜色越深表示点越密集

回归分析

类别值的可视化展示

stripplot

swarmplot：用于分簇散点图，避免点的重叠

小提琴图 violinplot

条形图barplot：显示数据的集中趋势

lvplot（） LV图表

countplot（）计数柱状图

pointplot折线图：更好地描述变化差异

盒图boxplot ：显示数据的五数概括

factorplot ：多层面板分类图

catplot

参数解释

boxenplot() ： 优化版的箱线图

Facetgrid

参数解释

指定画图的顺序

绘制子图

PairGrid ：画对图

heatmap :热力图、热度图

绘制半边热图

你可能感兴趣的:(python机器学习)

stripplot()：散点图

cubehelix_palette() 调色板：色调线性变换

`.jointplot()` 画散点图

boxenplot() ：优化版的箱线图