Python数据挖掘:数据转换-数据规范化

来源:天善智能韦玮老师课堂笔记
作者:Dust
----------
数据转换:
简单变换
1、数据变换的目的是降数据转化为更方便分析的数据。
2、简单变换通常使用函数变换的方式进行,常见的函数变换包括:开方、平方、对数等。

数据规范化
1、离差标准化--消除量纲(单位)影响以及变异大小因素的影响。
x1=(x-min)/(max-min)
2、标准差标准化--消除单位影响以及变量自身变异影响。
x1=(x-平均数)/标准差
3、小数定标规范化--消除单位影响
x1=x/10**(k)
k=log10(x的绝对值的最大值)

# import pymysql
import pandas as pda
import numpy as npy
data=pda.read_csv("G:/Python/data/starcraft.csv")
#---数据规范化---
#离差标准化
data2=(data-data.min())/(data.max ()-data.min())
print("---data2---")
print(data2)
#标准差标准化
data3=(data-data.mean())/data.std()
print("---data3---")
print(data2)
#小数定标准规范化
k=npy.log10(data.abs().max ())
data4=data/10**k
print("---data4---")
print(data4)

Python数据挖掘:数据转换-数据规范化_第1张图片

你可能感兴趣的:(Python)