有序标称变量(Categorical Features)编码为数值变量(Continuous Features)详解及实践

有序标称变量(Categorical Features)编码为数值变量(Continuous Features)详解及实践

 

有一个带顺序的分类特征(例如,高、中、低)

使用pandas DataFrame的replace方法将字符串标签转换为数字等价表示。

replace的时候需要根据数据的等级设置自定义的字典。

 

dataframe.replace()

pd.DataFrame()

 

 

# Load library
import pandas as pd

# Create features
dataframe = pd.DataFrame({"Score": ["Low", "Low", "Medium", "Medium", "High"]})

# Create mapper
scale_mapper = {"Low":1,
                "Medium":2,
                "High":3}

# Replace feature values with scale
dataframe["Score"].replace(scale_mapper)
0    1
1    1
2    2
3    2
4    3
Name: Score, dtype: int64

dataframe = pd.DataFrame({"Score": ["Low",
                                    "Low",
                                 

你可能感兴趣的:(数据科学,机器学习面试,机器学习,深度学习,数据分析,python,数据挖掘)