import pandas as pd
from sklearn import preprocessing
//读入数据
# df = pd.read_excel('test.xlsx',sheet_name='test') #这一句读取到excel文件数据
df = pd.read_csv('data.csv') #想要读取的文件数据
data = df.iloc[0:101, 0:8].copy().values #0:101, 0:8想要读的行0到101行,和0到8列
print(data) #展示读到的数据
//开始归一化
min_max_scaler = preprocessing.MinMaxScaler() #归一化到0-1
X_train_minmax = min_max_scaler.fit_transform(data)
print(X_train_minmax) #归一化之后结果
//将数据写入csv文件
df = pd.DataFrame(X_train_minmax) #类型问题,没有这一句报错
df.to_csv('data_new.csv') #将处理后的数据写入文件
说明:
1.读入数据、归一化、写入文件三部分可以拆开,按需使用
2.这里归一化使用的是0-1归一化,还有其他,归一化方法如z-score
3.读取CSV文件或者excel一般都读不到第一行,第一行默认为列标签
3.写入csv文件时,最开始直接写的df_to.csv,报错,查阅发现是类型问题,查阅的链接如下,具体解决方法已经截图。该回复最后一行应该是df不是dt,具体参照我上面写的代码即可。
说明1.如何把python计算的结果输出到.csv,'numpy.ndarray' object has no attribute 'to_csv‘-Python-CSDN问答