2020.10.11-基于改进AlexNet的广域复杂环境下遮挡猕猴桃目标识别

主要宏观问题

这篇论文要解决什么问题?

晴天(白天逆光、侧逆光)、阴天及夜间补光条件下的广域复杂环境中猕猴桃因枝叶遮挡部分果实重叠遮挡所导致的识别精度较低的问题。

 

 

这篇论文用了什么方法?

使用以Im-AlexNet为BackBone的Faster RCNN

 

 

 

这篇论文的创新点是什么?

 

 

 

作者最引以为豪的结论是什么?

对AlexNet网络进行参数修改,将网络的识别精度提高到了96.00%,且识别单幅图像的时间约为1s,可以满足猕猴桃采摘机器人在实际生产中对视觉系统识别精度及识别速度的要求。

利用搭建的猕猴桃采摘机器人试验平台,对猕猴桃的识别进行了测试,比其他网络具有更高的识别精度。

 

 

 

这篇论文可以达到什么效果?

对晴天逆光、晴天侧逆光、阴天和夜间补光条件下存在遮挡情况的图像识别精度为96.00%,单幅图像的识别时间约为1s。

 

 

 

用的什么对比算法?

以LeNet、AlexNet 和 VGG16 为BackBone的Faster RCNN。

 

 

效果比对比算法高了多少?

在相同数据集下,Im AlexNet 网络识别精度比 LeNet、AlexNet 和 VGG16 3 种网络识别精度的平均值高出 5.74 个百分点。

晴天逆光(Sunnybacklight,SB)、

侧逆光(Sunnyrembrandtlight,SR)、

阴天(Cloudy,CL)

夜间补光(Nightwithillumination,NI;光照强度为30~50lx)

2020.10.11-基于改进AlexNet的广域复杂环境下遮挡猕猴桃目标识别_第1张图片

 

这篇论文是如何展开讨论的?

不同光照条件下的识别结果

对存在遮挡的

 

 

 

这篇论文的难点是什么?

 

 

 

这篇论文存在的问题是什么?

 

 

 

作者的未来展望是什么?

 

 

 

技术细节

主要的操作步骤是什么?

 

 

 

 

网络在原始AlexNet的基础上有哪些改进改进?

保留AlexNet原网络的卷积层,同时对全连接层参数进行调整。L6为768,L7为256,L8为2。

损失函数:二次均方误差,MSSE

2020.10.11-基于改进AlexNet的广域复杂环境下遮挡猕猴桃目标识别_第2张图片

 

2020.10.11-基于改进AlexNet的广域复杂环境下遮挡猕猴桃目标识别_第3张图片

 

 

 

 

 

 

对网络进行修改的依据是什么

由于卷积层的作用是提取图像特征,所有直接使用AlexNet网络的卷积层参数,加载预训练权重,而全连接层是用来分类的,所以更换AlexNet最后的一个全连接层的参数1000为2。

原来是1000类的识别,现在变成了一个2分类的识别精度肯定是会有所提高。

 

并对网络进行调参,通过将AlexNet中L6、L7的全连接层参数从2^4~2^14依次设置进行多轮训练,并将L6、L7全连接层在不同参数设置下的网络识别精度(Averageprecision,AP)VAP进行对比,识别精度在不同参数设置下的统计结果,如表2所示。经对测试集进行试验得出,当AlexNet中的全连接层L6、L7的节点数为768256时,改进的AlexNet对猕猴桃果实识别精度最高。

 

 

 

 

数据集的来源

本文试验样本数据库的图像采集地点选自陕西省秦岭北麓猕猴桃产区西北农林科技大学(眉县)猕猴桃试验站,以海沃德猕猴桃作为本研究所需图像采集对象。

 

 

数据集有多大?

采集广域复杂环境中晴天逆光晴天侧逆光阴天夜间补光条件下存在遮挡情况的4类样本图像共1823幅,图像总共包含猕猴桃果实样本约为 46 394 个,建立试验样本数据库进行训练并测试。

将所采集样本统一设置为jpg格式的多尺度RGB图像(分辨率为640像素x360像素、640像素x480像素、1920像素x1080像素),以避免因棚架高度不均匀造成的遮挡果实图像多样性的影响。

 

数据集的预处理?

本研究将试验样本数据库中的1823幅猕猴桃样本图像,进行亮度、对比度调整,分别将亮度、对比度设置为60%、70%、80%、90%、110%、120%、130%、140%,并将高亮度设置为120%和140%。

 

将试验样本进行数据增强(Data augmentation),经扩充后,样本集图像数量增加到21147幅。随机抽选65%的样本数据(15132幅)作为训练集,剩余35%样本数据(6015幅)作为测试集。

2020.10.11-基于改进AlexNet的广域复杂环境下遮挡猕猴桃目标识别_第4张图片

 

 

使用的硬件设备

 

 

 

 

网络的训练参数

对候选区域网络RPN进行多轮训练并进行测试试验。具体训练过程中,将起始学习率(Learningrate)设为0.001,每批图像数量设置为64,动量(Momentum)设置为0.9,权值衰减(Decay)设置为0.0005,最大迭代次数设置为60次;并在L6、L7全连接层中加入Dropout层,以确保每层提取特征的相互独立,同时将防止过拟合Dropout设置为0.4,此时网络的识别精度较高。

ImAlexNet最终输出为猕猴桃目标果实的识别结果,为提高猕猴桃目标的识别精度,本研究仅保留置信度大于0.85的目标

 

实验如何验证?

嵌入式平台中+机器人视觉识别模块中进行

 

 

 

论文写作层面

这篇论文的写作流程是怎样的?

 

 

这篇论文的写作过程中存在的问题是什么?

 

 

这篇论文如何处理对自己不利的数据?

 

 

 

这篇论文的写作过程中有什么值得借鉴的地方?

将深度学习算法放到了嵌入式平台上进行验证。

 

 

 

 

不懂的概念

Im-AlexNet具体是什么模型?

AlexNet网络的卷积层结构不变,将最后一个全连接层的参数设置为2,这个自己提出来的AlexNet网络就自己命名为Im AlexNet。

 

2020.10.11-基于改进AlexNet的广域复杂环境下遮挡猕猴桃目标识别_第5张图片

 

 

什么叫做广域复杂环境?

 

 

 

 

 

 

AlexNet网络的结构参数分别是什么样的?

2020.10.11-基于改进AlexNet的广域复杂环境下遮挡猕猴桃目标识别_第6张图片

 

 

AlexNet L6、L7 的节点数原来是多少?

L6:4096

L7:4096

 

你可能感兴趣的:(论文笔记-检测)