机器学习— —特别特征编码

DAY2

    • 将英文id转为数值编码
    • 编码结果
    • 将某特征转为数值编码
    • 编码结果

将英文id转为数值编码

  • 因为机器学习是处理数值的(高维),所以当某些初始特征不是以数值形式出现时,要通过适当的方式进行处理。
    在本数据集中,每一组数据的id是国家,即为英语名称:
    机器学习— —特别特征编码_第1张图片
    所以下面通过get_dummies()函数进行处理,实现哑变量编码:
# 特别特征编码
# 特征X
X = pd.get_dummies(X)
X = X.values

机器学习— —特别特征编码_第2张图片

编码结果

机器学习— —特别特征编码_第3张图片

将某特征转为数值编码

在本数据集中,y列是结果,即为true和false:
机器学习— —特别特征编码_第4张图片
所以下面通过fit_transform()函数进行处理:

# 标签y
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
# 将数据做一个标签,同样重复的用一个
y = le.fit_transform(y)

机器学习— —特别特征编码_第5张图片

编码结果

机器学习— —特别特征编码_第6张图片

你可能感兴趣的:(机器学习,python实践,python,人工智能)