DAY4 特征工程(上)

由于大概率不想跨行以及走回头路,老老实实开始研究码农的技术。开始固本培元,补充一下机器学习的基础知识。

主要知识点:

  1. 理解归一化原因
  2. 归一化的方式需要考虑的原始分布可能的属性
  3. 类别型特征可以使用二进制编码达到比one hot节约空间的目的

遗留问题:

  1. 其他编码方式可以学习一下
  2. 高维组合特征中矩阵分解的思想还不理解
  3. 决策树是如何直接处理字符串

学习路线:

image.png

你可能感兴趣的:(DAY4 特征工程(上))