数据预处理的python实现

1、归一化

1.1简单处理列表

#归一化处理
raw = [0.07, 0.14, 0.07]  

norm=[float(i)/max(raw) for i in raw]
print(norm)

1.2 处理嵌套列表:

#归一化处理
raw = [[0.07, 0.14, 0.07],[1,2, 3]]

norm=[]
for i in range(len(raw)):
	norm.append([float(j)/max(raw[i]) for j in raw[i]])

print(norm)

2、查看字符串数据

一些csv文件读取的数据,往往是数字和字符串混在一起的,如何string类型的数据不多,可以通过以下代码来查看:

##
Counter(X.dtypes.values)
X.select_dtypes(include=['O']).columns

你可能感兴趣的:(python,工业过程监测)