python 分类型数据转化数值型

将分类型变量转换成数值型变量的两种方法
一、map映射

性别映射数值
先创建一个map ,再将map映射到表格中的值

sex_mapping = {"male": 0, "female": 1}
train_df['Sex'] = train_df['Sex'].map(sex_mapping)

二、get_dummies()函数

俗称独热编码(one-hot编码)

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False)

参数说明:

  • data : array-like, Series, or DataFrame 输入的数据
  • prefix : string, list of strings, or dict of strings, default None
  • get_dummies转换后,列名的前缀
  • columns : list-like, default None 指定需要实现类别转换的列名
  • dummy_na : bool, default False 增加一列表示空缺值,如果False就忽略空缺值
  • drop_first : bool, default False 获得k中的k-1个类别值,去除第一个
    python 分类型数据转化数值型_第1张图片
    类似SPSS中将分类型变量替换成数值型变量的转换过程

三、直接定位替换

Sex性别列处理:male用0,female用1

data_train.loc[data_train["Sex"] == "male","Sex"] = 0
data_train.loc[data_train["Sex"] == "female","Sex"] = 1

结果与第一种方法一致

你可能感兴趣的:(python)