seaborn详解--类型05

import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="whitegrid", color_codes=True)

np.random.seed(sum(map(ord, "categorical")))
titanic = sns.load_dataset("titanic")  #加载内置的数据 库
tips = sns.load_dataset("tips")
iris = sns.load_dataset("iris")
sns.stripplot(x="day", y="total_bill", data=tips);

seaborn详解--类型05_第1张图片

重叠是很常见的现象,但是重叠影响我观察数据的量了

sns.stripplot(x="day", y="total_bill", data=tips, jitter=True) #jitter在x y两个方向上偏移

seaborn详解--类型05_第2张图片

sns.swarmplot(x="day", y="total_bill", data=tips)

seaborn详解--类型05_第3张图片

sns.swarmplot(x="day", y="total_bill", hue="sex",data=tips)

seaborn详解--类型05_第4张图片

sns.swarmplot(x="day", y="total_bill", hue="sex",data=tips)

seaborn详解--类型05_第5张图片

盒图

  • IQR即统计学概念四分位距,第一/四分位与第三/四分位之间的距离
  • N = 1.5IQR 如果一个值>Q3+N或 < Q1-N,则为离群点


sns.boxplot(x="day", y="total_bill", hue="time", data=tips);

seaborn详解--类型05_第6张图片

sns.violinplot(x="total_bill", y="day", hue="time", data=tips);

seaborn详解--类型05_第7张图片


sns.violinplot(x="day", y="total_bill", hue="sex", data=tips, split=True);# split代表左右分开 代表的是sex的Male和Female

seaborn详解--类型05_第8张图片

sns.violinplot(x="day", y="total_bill", data=tips, inner=None)
sns.swarmplot(x="day", y="total_bill", data=tips, color="w", alpha=0.1) #alpha 代表的是里面小圈的透明度

seaborn详解--类型05_第9张图片

显示值的集中趋势可以用条形图

sns.barplot(x="sex", y="survived", hue="class", data=titanic); #查看不同的仓级别 获救的情况 

seaborn详解--类型05_第10张图片


sns.pointplot(x="sex", y="survived", hue="class", data=titanic);

seaborn详解--类型05_第11张图片

sns.pointplot(x="class", y="survived", hue="sex", data=titanic,
              palette={"male": "g", "female": "m"},
              markers=["^", "o"], linestyles=["-", "--"]); #maekers代表点的标记  linestyles代表线的标记

seaborn详解--类型05_第12张图片

sns.boxplot(data=iris,orient="h");

seaborn详解--类型05_第13张图片

多层面板分类图


sns.factorplot(x="day", y="total_bill", hue="smoker", data=tips)

seaborn详解--类型05_第14张图片


sns.factorplot(x="day", y="total_bill", hue="smoker", data=tips, kind="bar")

seaborn详解--类型05_第15张图片

sns.factorplot(x="day", y="total_bill", hue="smoker",
               col="time", data=tips, kind="swarm")

seaborn详解--类型05_第16张图片

sns.factorplot(x="time", y="total_bill", hue="smoker",
               col="day", data=tips, kind="box", size=4, aspect=.5)

seaborn详解--类型05_第17张图片


seaborn.factorplot(x=None, y=None, hue=None, data=None, row=None, col=None, col_wrap=None, estimator=, ci=95, n_boot=1000, units=None, order=None, hue_order=None, row_order=None, col_order=None, kind='point', size=4, aspect=1, orient=None, color=None, palette=None, legend=True, legend_out=True, sharex=True, sharey=True, margin_titles=False, facet_kws=None, **kwargs)

Parameters:

  • x,y,hue 数据集变量 变量名
  • date 数据集 数据集名
  • row,col 更多分类变量进行平铺显示 变量名
  • col_wrap 每行的最高平铺数 整数
  • estimator 在每个分类中进行矢量到标量的映射 矢量
  • ci 置信区间 浮点数或None
  • n_boot 计算置信区间时使用的引导迭代次数 整数
  • units 采样单元的标识符,用于执行多级引导和重复测量设计 数据变量或向量数据
  • order, hue_order 对应排序列表 字符串列表
  • row_order, col_order 对应排序列表 字符串列表
  • kind : 可选:point 默认, bar 柱形图, count 频次, box 箱体, violin 提琴, strip 散点,swarm 分散点 size 每个面的高度(英寸) 标量 aspect 纵横比 标量 orient 方向 "v"/"h" color 颜色 matplotlib颜色 palette 调色板 seaborn颜色色板或字典 legend hue的信息面板 True/False legend_out 是否扩展图形,并将信息框绘制在中心右边 True/False share{x,y} 共享轴线 True/False







你可能感兴趣的:(机器学习)