机器学习Python实践-第三部分-数据准备

数据预处理:

根据数据本身特性,进行数据准备、数据转换,数据输出

#!/user/bin/python
# -* - coding:UTF-8 -*-
from pandas import read_csv
#使用Pandas导入CSV数据
from numpy import set_printoptions
from sklearn.preprocessing import MinMaxScaler

#导入数据
filename = 'pima_data.csv'
names = ['preg','plas','pres','skin','test', 'mass','pedi','age','class']
data = read_csv(filename,names=names)

#将数据分为输入数据和输出数据
array=data.values
X=array[:,0:8]
Y=array[:,8]
transformer=MinMaxScaler(feature_range=(0,1))
#数据转换
newX=transformer.fit_transform(X)
#设置数据的打印格式
set_printoptions(precision=3)
print newX


你可能感兴趣的:(机器学习)