Python中的数据标准化

数据标准化

数据标准化是指将数据按比例缩放,使之落入到特定区间。
为了消除量纲的影响,方便进行不同变量间的比较分析。
0-1标准化:
x=(x-min)/(max-min)
Python代码实现:

import pandas

data = pandas.read_csv(
    'D:\\PDA\\4.14\\data.csv'
)

data['scale'] = round(
    (
        data.score-data.score.min()
    )/(
        data.score.max()-data.score.min()
    )
    , 2
)

注意:

Python中,如果需要访问数据框中的某一列,用data["name"]或者data.name均可访问。

如果需要增加一列,则须使用data["total"]=data.score*data.num 才能实现。这个时候用data.XX会报错。

数据的标准化在衡量比较两个不同量纲数据的时候,非常常用。


你可能感兴趣的:(Python数据分析篇)