sklearn使用OneHotEncoder

data = ['cold', 'cold', 'warm', 'cold', 'hot', 'hot', 'warm', 'cold', 'warm', 'hot']
values = np.array(data)
values.shape # (10,)
# 必须转换为二维得矩阵
values_reshape = values.reshape((-1,1)) # (10, 1) 
onehot_encoder = OneHotEncoder(sparse=False)
onehot_encoder.fit_transform(values_reshape)
# 结果如下
array([[1., 0., 0.],
       [1., 0., 0.],
       [0., 0., 1.],
       [1., 0., 0.],
       [0., 1., 0.],
       [0., 1., 0.],
       [0., 0., 1.],
       [1., 0., 0.],
       [0., 0., 1.],
       [0., 1., 0.]])

你可能感兴趣的:(机器学习)