使用OneHotEncoder 独热编码

from sklearn import preprocessing
enc = preprocessing.OneHotEncoder() #()里面没有参数,写了n_values=[2,3,4]后保错
enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])   # 按照这些训练一下

for i in range(0,2):#不包含上界2 取0 1
    for j in range(0,3):#取0 1 2
        for k in range(0,4):# 取0 1 2 3
            print('[',i,j,k,']','的编码为:',
                  enc.transform([[i, j, k]]).toarray())

第一列的取值为 0 1

第二列的取值为 0 1 2

第三列的取值为 0 1 2 3

[ 0 0 0 ] 的编码为: [[1. 0. 1. 0. 0. 1. 0. 0. 0.]]
[ 0 0 1 ] 的编码为: [[1. 0. 1. 0. 0. 0. 1. 0. 0.]]
[ 0 0 2 ] 的编码为: [[1. 0. 1. 0. 0. 0. 0. 1. 0.]]
[ 0 0 3 ] 的编码为: [[1. 0. 1. 0. 0. 0. 0. 0. 1.]]

省略....太多了写不下

你可能感兴趣的:(sklearn)