机器学习中常见的离散变量的编码方式 labelencoding(标签编码)

  • labelencoding(标签编码)
# dataset为数据集  product_tags为需要编码的特征列(假设为第一列)
product_tags = dataset.iloc[:, :1]
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder() #实例化
le = le.fit(product_tags)
label = le.transform(product_tags)
le.classes_  # 查看有哪些标签
label  # 查看编码的结果
# 将编码结果替换为原来列
dataset.iloc[:, :1] = label

完工! 赶紧丢到算法中看看效果吧!

你可能感兴趣的:(机器学习算法实现)