数据预处理技术

数据预处理技术_第1张图片

数据预处理的必要性:在真实世界中,经常需要处理大量的原始数据,这些原始数据是机器学习算法无法理解的,所以为了让机器学习算法理解原始数据,需要对数据进行预处理。最常用的数据预处理技术:

1. 均值移除(Mean removal)

把每个特征的平均值移除,以保证特征均值为0(即标准化处理),这样做可以消除特征彼此间的偏差。

import numpy as np
from sklearn import preprocessing

data=np.array([[3, -

你可能感兴趣的:(金融科技与数据,python,numpy)