【Yellowbrick】特征可视化分析

Yellowbrick特征可视化分析

  • ⭐Yellowbrick
  • ⭐特征分析可视化
    • ⭐Rank1D
    • ⭐Rank2D

⭐Yellowbrick

Yellowbrick是一个用于可视化机器学习模型和评估性能的Python库。它提供了一系列高级可视化工具,帮助数据科学家和机器学习从业者更好地理解、调试和优化他们的模型。
它在scikit-learn的api基础上做了扩展,能让我们更容易的驾驭模型优化阶段。

⭐特征分析可视化

⭐Rank1D

默认情况下,Rank1D使用Shapiro-Wilk算法来评估特征分布的正态性。然后绘制条形图,显示每个特征的相对等级
默认情况下,Rank2D可视化工具使用皮尔逊相关系数检测两个特征之间的相关性。

import matplotlib.pyplot  as plt
import pandas as pd
# 导入数据
df=pd.read_excel("D:\A_data\Data_2022.C\高钾无风化.xlsx")
m=['类型']
y=df[m]
#print(y)
i=['氧化钾(K2O)','氧化钙(CaO)','二氧化硅(SiO2)','二氧化硅(SiO2)','氧化镁(MgO)','氧化铝(Al2O3)',
   '氧化铁(Fe2O3)','氧化铜(CuO)','氧化铅(PbO)','氧化铅(PbO)','五氧化二磷(P2O5)','氧化锶(SrO)','氧化锡(SnO2)','二氧化硫(SO2)']
X=df[i]
#print(X)

【Yellowbrick】特征可视化分析_第1张图片

【Yellowbrick】特征可视化分析_第2张图片

#解决中文乱码问题
plt.rcParams['font.sans-serif']=['SimHei']

from yellowbrick.features import rank1d
visualizer = rank1d(X, color="b")

【Yellowbrick】特征可视化分析_第3张图片

⭐Rank2D

默认情况下,Rank2D可视化工具使用皮尔逊相关系数检测两个特征之间的相关性。

#解决保存图像是负号'-'显示为方块的问题
plt.rcParams['axes.unicode_minus']=False
from yellowbrick.features import rank2d
visualizer = rank2d(X, color="b")

【Yellowbrick】特征可视化分析_第4张图片

你可能感兴趣的:(机器学习,人工智能,机器学习,python,matplotlib)