基于pycaffe从零开始写mnist(第一篇)——生成txt文件

遇到的问题:

1.F0725 23:05:55.042811  4306 common.cpp:158] Check failed: error == cudaSuccess (10 vs. 0)  invalid device ordinal
*** Check failure stack trace: ***


因为我在set_device上设置为第二块gpu,但是仅仅有一块gpu,因此会报错,所以应该执行gpu为set_device(0)

caffe.set_device(1)

2.F0725 23:28:49.673435  4586 image_data_layer.cpp:148] Check failed: cv_img.data Could not load 
*** Check failure stack trace: ***

竟然报找不到图片的错误,莫名其妙,我写的可是全路径啊

好吧,从当前路径开始往下写,终于找到文件了,因此在将txt文件传入神经网络的时候,并非输入全路径,而是输入相对路径

--------------------------------------------------------------------------------
这里要注意:生成的txt文件的图片路径一定要是相对路径

具体代码如下:
# -*- coding: utf-8 -*-
__author__ = 'xuy'

"""
用来生成txt文件,最终生成的是的路径是相对路径,不是绝对路径

格式是:
图片文件名 label(也就是文件夹名称)



"""




import commands
import os
import re
import random




train_root_dir='mnist/train'
test_root_dir='mnist/test'

train_save_name=train_root_dir+'/mytrain.txt'
test_save_name=test_root_dir+'/mytest.txt'
fw_train=open(train_save_name,'w')#打开的是文件名称
fw_test=open(test_save_name,'w')
for parent,dirnames,filenames in os.walk(train_root_dir):#三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字
#开始遍历train文件夹下面的所有的文件名称
    for filename in filenames:

        pattern_train=r'(\d{0,10}.png$)'
        pattern_train_png_filename=re.search(pattern_train,filename)
        if pattern_train_png_filename !=None:
            train_png_filename=pattern_train_png_filename.group(0)#这个是以png为后缀名的文件名,其他文件名被过滤掉了
            train_all_file_name=os.path.join(parent,train_png_filename)#添加了全路径名称
            # print "the full filename is: ",train_all_file_name

            train_label_FileName=train_all_file_name[-11:-10]
            # print "the train label is :",train_label_FileName

            train_WriteFile_content=train_all_file_name+' '+train_label_FileName+'\n'
            # shuffle_train_WriteFile_content=random.sample(train_WriteFile_content,len(train_WriteFile_content))

            fw_train.write(train_WriteFile_content)

        # print "parent is:" + parent
        # print "filename is:" + filename
        # all_file_name=os.path.join(parent,filename)
        # print "the full filename is: ",all_file_name #输出文件路径信息

for parent,dirnames,filenames in os.walk(test_root_dir):
    for filename in filenames:

        pattern_test=r'(\d{0,10}.png$)'
        pattern_test_png_filename=re.search(pattern_test,filename)
        if pattern_test_png_filename !=None:
            test_png_filename=pattern_test_png_filename.group(0)
            test_all_file_name=os.path.join(parent,test_png_filename)
            # print "the full filename is: ",test_all_file_name
            test_label_FileName=test_all_file_name[-11:-10]
            test_WriteFile_content=test_all_file_name+' '+test_label_FileName+'\n'
            # random.shuffle(test_WriteFile_content)这个报错
            # shuffle_test_WriteFile_content=random.sample(test_WriteFile_content,len(test_WriteFile_content))
            fw_test.write(test_WriteFile_content)


fw_train.close()
fw_test.close()


 


此时生成的文件是有顺序的,这就会导致训练的时候准确率不高,实验的时候,才10%多一点,因此需要打乱顺序

通过系统命令:shuf train.txt >shuf_train.txt,这样就生成了一个乱序的txt文件,因此就可以进入下一篇,构造网络结构+训练了


你可能感兴趣的:(my_caffe项目实战)