python机器学习(二)特征工程、K-近邻算法、KNN工作流程、scikit-learn实现K近邻算法、K值选择、距离计算、KD树
特征工程把特征转换为机器容易识别的数据,把特征a转化为机器容易读懂、量化的语言归一化Min-Max将原始数据映射到[0,1]之间X′=x−minmax−minX'=\frac{x-min}{max-min}X′=max−minx−min但是归一化是有弊端的,比如有一个值错误,就会影响整体的数值,并且归一化是无法解决这个异常值。所以归一化只适合传统精确小数据场景。标准化通过对原始数据进行变换把数据变