为了实现我们对特定场景下的图像识别功能,我们需要依托YOLO V8工具,对大量的图片进行目标标准和训练。因此我们首先要做的一项工作便是准备大量的用于标准和训练做续的图片。
在实际项目中,很难有现成的大量图片作为素材供我们使用,需要我们人工整理或者下载。以图像识别应用最为广泛的公安交管领域为例,交警部门所需要识别的场景都是比较简单化、单一化的场景,其素材很容易获取,但是难度在于他场景的多样,以及不同类型摄像头采集的像素情况、画质情况以及对场景识别所需角度的不一致,比如在对电动自行车是否佩戴头盔的场景下,有可能是使用专门用于拍摄机动车道路的摄像头来识别非机动车道上的电动自行车,这就造成了所需要识别的场景都在画面最边缘,或者尺寸较小,导致识别难度增大。这就需要我们用更加充分的素材来充分训练。
下面,笔者将通过网络下载和自行整理的手段为读者一步一步的讲解如何实现。
通常而言,下载图片大家第一个想到的就是爬虫,但是找到合适的素材网站比较麻烦,因为很多时候,很难有一个网站吧我们在具体领域(比如交通管理方面)收集大量的图片并放在网上。因此很多时候要借助于百度图片搜索来获取。
对于很多读者朋友而言,编写抓取百度图片搜索等有较高反爬虫机制的网站难度是比较大的,为此,笔者为大家推荐一款比较实用,且很容易上手的图片抓取工具simple_image_downloader。
笔者为大家推荐一款python工具,叫做simple_image_download,这个第三方库可以直接用几行脚本调用google搜索关键词图片