机器学习实战(第2章)

一.快速查看数据结构

1.housing.head(): 查看DataFrame的前52.housing.info(): 查看DataFrame的总行数,每个属性的类型及非空值的数量
    
3.housing['xx'].value_counts(): 查看有多少xx有多少取值,每种取值分别有多少数量
    
4.housing.describe(): 显示DataFrame中的数值摘要

二.创建测试集(只把函数列出)

1.train_test_split:纯随机的抽样方法
from sklearn.model_selection import train_test_split

2.StratifiedShuffleSplit:分层抽样
from sklearn.model_selection import StratifiedShuffleSplit

三:DataFrame可视化

housing.plot(kind="scatter",x=" ",y=" ",alpha=)
plt.show(

你可能感兴趣的:(机器学习实战(第2章))