Python分类实例之猫狗大战_ZHW_AI课题组的博客-CSDN博客
放在自己的设备上有哪些东西需要修改?
1.读取数据部分:getdata.py部分
dir表示你的数据集的上一级文件夹的位置,file表示你数据集文件的名字。
dir = dir + '/train/':train部分要写你定义的数据集的名字。
这种情况:dir:D:\BaiduNetdiskDownload\train
file:train
name = file.split(sep='')
分隔符需要根据你的文件名修改:下列情况要使用name = file.split(sep='_')
这个分隔符如果没有修改,保留name = file.split(sep='.'),对于文件名cat_1.jpg
根据代码所有的数据都被识别成狗,这样训练之后,测试集只有一种结果:所有图片都是狗。
if name[0] == 'cat':
self.list_label.append(0) # 图片为猫,label为0
else:
self.list_label.append(1)
2.训练过程train.py
要根据存放的数据集的位置放置。
如果没有写清楚地址,会出现地址错误的报错。
dataset_dir = 'D:/BaiduNetdiskDownload/train'
def train():
datafile = DVCD('train', dataset_dir)
要先设置一个文件夹存放模型:
model_cp是要存放模型文件(model.pth)的文件夹地址。
必须要在运行之前新建好文件夹,否则train的网络模型参数没有地方保存,出现找不到地址的错误。
model_cp = 'D:/BaiduNetdiskDownload/model'
torch.save(model.state_dict(),'{0}/model.pth'.format(model_cp)) # 训练所有数据后,保存网络的参数
3.测试部分test.py同理:
注意测试集需要的地址是数据集文件夹的,不是数据集上一级文件夹。
files = random.sample(os.listdir(dataset_dir), N)
dataset_dir = 'D:/BaiduNetdiskDownload/test/test'
model_file = 'D:/BaiduNetdiskDownload/model/model.pth'
如果dataset_dir写成以上形式:
dataset_dir = 'D:/BaiduNetdiskDownload/test/test'
注意:在这行代码中加入’/‘,否则地址名不完整,也会造成找不到文件的报错。
img = Image.open(dataset_dir + '/'+file)
因为原版代码:文件夹地址部分有’/‘,所以后续语句不用再加。
dataset_dir = './data/test/'
4.运行之后我的正确率大概只有50%。
所以我在network.py文件中加入了残差网络。
class ResidualBlock(nn.Module):
def __init__(self, channels):
super(ResidualBlock, self).__init__()
self.channels = channels
self.conv1 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
self.conv2 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
def forward(self, x):
y = F.relu(self.conv1(x))
y = self.conv2(y)
return F.relu(x + y)
def forward(self, x): # 重写父类forward方法,即前向计算,通过该方法获取网络输入数据后的输出值
x = self.conv1(x) # 第一次卷积
x = F.relu(x) # 第一次卷积结果经过ReLU激活函数处理
x = F.max_pool2d(x, 2) # 第一次池化,池化大小2×2,方式Max pooling
x = self.rblock1(x)
x = self.conv2(x) # 第二次卷积
x = F.relu(x) # 第二次卷积结果经过ReLU激活函数处理
x = F.max_pool2d(x, 2) # 第二次池化,池化大小2×2,方式Max pooling
x = self.rblock2(x)
x = x.view(x.size()[0], -1) # 由于全连层输入的是一维张量,因此需要对输入的[50×50×16]格式数据排列成[40000×1]形式
x = F.relu(self.fc1(x)) # 第一次全连,ReLU激活
x = F.relu(self.fc2(x)) # 第二次全连,ReLU激活
y = self.fc3(x) # 第三次激活,ReLU激活
正确率在60%。