神经网络方法数据标签处理LabelEncoder

本文介绍一个简单的编码转换方式。对不连续的标签编码成向量表示。

这个方法,用在神经网络实现分类任务时比较常见,对于神经网络输出层,输出一个向量,可以定义哪个维度是1,就代表是哪个类别。

#导包

from sklearn.preprocessing import LabelEncoder

from keras.utils import np_utils

#例子

a = [1, 2, 3, 4, 2, 1, 1, 2, 4]
encoder = LabelEncoder()
encoded_Y = encoder.fit_transform(a)
dummy_y = np_utils.to_categorical(encoded_Y)

print(dummy_y, dummy_y.shape)

#运行结果

神经网络方法数据标签处理LabelEncoder_第1张图片

结果分析:

a列表中有1, 2, 3, 4这几种数字,每个数字结果是一个4列的行向量。

每个行向量哪一列是1,这个行向量就代表这个数字是几。


你可能感兴趣的:(fen)