在数据使用前,需要进行数据预处理。
现在有一个txt文件内存有数据,希望删除其最后一列。
删除前 删除后
实现代码:
import numpy as np
import os
def dataprocess():
# read
data = []
with open('../3_cluster/test.txt', 'r') as f:
for line in f.readlines():
data.append(line[:-1].split(','))
data = np.array(data)
print(data.shape)
# data process
data2 = []
for index, row in enumerate(data.T):
if index < len(data.T)-1:
data2.append(row)
data2 = np.array(data2)
print(data2) # 拿到了前2列数据
# write
a = data2.T
with open('../3_cluster/test2.txt', 'w') as f:
for i in range(len(a)):
for j in range(0, 2):
if j == 0:
f.write(str(a[i][j]) + ',')
else:
f.write(str(a[i][j]) + '\n')
# os.remove('../3_cluster/test.txt')
# os.rename('../3_cluster/test2.txt', '../3_cluster/test.txt')
if __name__ == '__main__':
dataprocess()
注:
(参考:
Python 内置函数之 open (文件操作)_fenglepeng的博客-CSDN博客_open文件操作)