python实现离散特征的 LabelEncoder编码和OneHotEncoder编码

LabelEncoder: xxx为属性名

from sklearn.preprocessing import LabelEncoder


encoder = LabelEncoder()
dataset['xxx'] = encoder.fit_transform(dataset['xxx'])

OneHotEncoder:单独特征编码  xxx为属性名

import pandas as pd


dataset= dataset.join(pd.get_dummies(dataset.xxx))

 

OneHotEncoder:所有特征编码 

import pandas as pd

dataset = dataset .get_dummies(dataset )

 

你可能感兴趣的:(python,数据挖掘,OneHotEncoder,LabelEncoder,离散特征)