Python文件处理:数据标签修改

今天在做眼底图像识别的时候,发现0级别和1,2,3,4级别的数量严重不等,所以想到了设计一个分级的卷积神经网络,先进行二分类,即0为一类,2,3,4为一类,这也就涉及到了训练集标签的修改了,所以用python写了一个小脚本。

train = open('trainLabels.txt','r')
train_new = open('trainLabels_new.txt','w+')
line = train.readline()
while line:
    line = list(line)
    label = line[len(line)-2]
    if label != '0':
        label = '1'
    line[len(line)-2]  = label
    line = ''.join(line)
    train_new.writelines(line)
    print line
    line = train.readline()
train.close()
train_new.close()

首先读取原先存放标签的trainLabels.txt文件,然后打开需要新建的trainLabels_new.txt,按行读老txt中的数据,这里使用了一个小技巧,因为python不能对字符串中的数据进行修改,只能新建,所以在这里把字符串类型做了一个强制转换,然后从list中读取倒数第二位(倒数第一位是‘\n‘)作为标签,然后做一个简单的逻辑变换,然后用一个.join()再把list转为字符串,再将其写进新的txt文件。

Python文件处理:数据标签修改_第1张图片

Python文件处理:数据标签修改_第2张图片

你可能感兴趣的:(深度学习,python学习笔记,文本处理)