机器学习的几个疑难杂症点(4)——变量编码方式(LabelEncoder、one-hot Encoding、dummy Encoding)
文章目录一、LabelEncoder编码方式对文本:对不连续数字:二、one-hotEncoding(独热编码)三、dummyEncding(哑编码)四、总结参考文档一、LabelEncoder编码方式LabelEncoder是对不连续的数字或文本编号。对文本:LabelEncoder可以将[中国,美国,日本]转化为[0,1,2],但这样会出现一个问题:中国和日本的平均会等于日本。决策树、随机森林