EDA可视化

1. 文件名 visualization_utils.py

  • EDA可视化通用方法汇总

1.1 连续特征

  • 用于连续特征可视化

1.1.1 dist_numb_target

  • 单个连续特征分布图(二分类),y取值类型需为int型0,1
    EDA可视化_第1张图片

1.1.2 ploting_numb_fets

  • 多连续特征分布(二分类),参数draw_type:绘图类型,取值:dist_y(按y分布图),dist(分布图),box_y(按y增强箱形图),box(增强箱形图)
    EDA可视化_第2张图片
    EDA可视化_第3张图片
    EDA可视化_第4张图片
    EDA可视化_第5张图片

1.1.3 dist_target_detail

  • 连续特征基于target的区间分布。
  • 可调节x轴区间范围。
    EDA可视化_第6张图片

1.2 类别特征

  • 用于类别特征或离散特征可视化

1.2.1 dist_cate_target

  • 单个类别特征分布绘图(二分类)
    EDA可视化_第7张图片

1.2.2 ploting_cat_fets

  • 多类别特征或离散特征target正类分布,y取值类型需为int型0,1
    EDA可视化_第8张图片

1.3 目标分布

1.3.1 target_dist_plot

  • 二分类目标分布
    EDA可视化_第9张图片

1.4 相关性

1.4.1 correlation_heatmap

  • 相关性热力图
    EDA可视化_第10张图片

你可能感兴趣的:(可视化,EDA)