数据预处理之使用pandas将标签进行数值化表示

在实际机器学习、深度学习场景下,我们开始拿到的数据其实可能是这样的
在这里插入图片描述
需要将数值做一个替换,变成:

原有值 替换后
pos 1
neg 0

可以使用pandas包的apply去快速处理大批量的数据

import pandas

data = {"label": ["pos", "neg", "neg", "neg", "pos", "pos"]}
date_frame = pandas.DataFrame(data)
date_frame["label"] = date_frame['label'].apply(lambda x: 1 if x == "pos" else 0)
print(date_frame)

数据预处理之使用pandas将标签进行数值化表示_第1张图片

你可能感兴趣的:(pandas,python,开发语言)