机器学习步骤——以房价预测为例

导入数据

数据清洗

数据清洗的一些梳理

  1. 查看数据,对数据有一个直观的理解,初步发现一些问题;
    例如:kaggle房价预测先查看每个数据的具体意义和数据类型和Exel对比。
    kaggle房价预测数据集的具体描述
  2. 缺失值清洗
  3. 格式内容清洗(显示格式不一致、存在不该有的字符、内容鱼该字段应有内容不符)
  4. 逻辑错误清洗(去重、去除不合理值、修正矛盾内容、非需求内容删掉、)
  5. 关联性验证

特征工程

输入特征X,得到X‘。例如MFCC特征提取。
使用sklearn做单机特征工程
https://images2015.cnblogs.com/blog/927391/201604/927391-20160430145122660-830141495.jpg机器学习步骤——以房价预测为例_第1张图片

模型选择

模型融合

你可能感兴趣的:(机器学习理论)