pandas中scatter_matrix函数

pandas中scatter_matrix函数

from pandas.plotting import scatter_matrix

attributes = ["median_house_value", "median_income", "total_rooms", "housing_median_age"]
scatter_matrix(housing[attributes], figsize=(12, 8))
plt.show()

pandas中scatter_matrix函数_第1张图片
pandas中scatter_matrix函数,它会绘制出每个数值属性相对于其他数值属性的相关值。如果pandas将每个变量都与自身相对,那么主对角线将全都是直线,这样毫无意义,所以取而代之的方法是,Pandas在这几个图中显示了每个属性的直方图。
scatter_matrix(frame, alpha=0.5, c,figsize=None, ax=None, diagonal='hist', marker='.', density_kwds=None,hist_kwds=None, range_padding=0.05, **kwds)

  1. frame:(DataFrame),DataFrame对象
  2. alpha:(float, 可选), 图像透明度,一般取(0,1]
  3. figsize: ((float,float), 可选),以英寸为单位的图像大小,一般以元组 (width, height) 形式设置
  4. ax:(Matplotlib axis object, 可选),一般取None
  5. diagonal:({‘hist’, ‘kde’}),必须且只能在{‘hist’, ‘kde’}中选择1个,’hist’表示直方图(Histogram plot),’kde’表示核密度估计(Kernel Density Estimation);该参数是scatter_matrix函数的关键参数,下文将做进一步介绍
  6. marker:(str, 可选), Matplotlib可用的标记类型,如’.’,’,’,’o’等
  7. density_kwds:(other plotting keyword arguments,可选),与kde相关的字典参数
  8. hist_kwds:(other plotting keyword arguments,可选),与hist相关的字典参数
  9. range_padding:(float, 可选),图像在x轴、y轴原点附近的留白(padding),该值越大,留白距离越大,图像远离坐标原点
  10. kwds:(other plotting keyword arguments,可选),与scatter_matrix函数本身相关的字典参数

你可能感兴趣的:(机器学习相关库,python,机器学习,pandas,数据分析)