机器学习之离散数据编码:独热编码(OneHotEncoder)和 标签编码(LabelEncoder)
1、独热编码(OneHotEncoder)有一些特征并不是以连续值的形式给出。例如以下三个特征属性:人的性别[“male”,“female”],来自的国家[“fromEurope”,“fromUS”,“fromAsia”],使用的浏览器[“usesFirefox”,“usesChrome”,“usesSafari”,“usesInternetExplorer”]。这种特征可以采用整数的形式进行编码