计算机视觉是人工智能领域最热门的话题之一。
但试图找出学习和掌握该领域的最佳方法很容易混淆。
我们的建议?
不要陷入分析理论概念的困境。
相反,将您的概念知识与实践经验相结合,开始构建您自己的计算机视觉模型!
在本文中,我们将与您分享一堆计算机视觉项目的想法,以帮助您在不到一个小时的时间内上手:
目录
人数统计工具
颜色检测
视频中的对象跟踪
行人检测
手势识别
人类情感识别
道路车道检测
名片扫描仪
车牌识别
手写数字识别
鸢尾花分类
全家福人脸检测
乐高积木探测器
个人防护装备检测
口罩检测
红绿灯检测
构建您的第一个计算机视觉模型:关键要点
构建人员计数解决方案既可以是一个有趣的项目,也可以是一个真正找到实际应用程序的项目。
要检测和计算图像中出现的人,您需要相关的训练数据集和数据训练平台。您可以使用像 OpenCV 这样的免费工具来标记您的数据,或者使用像 V7 这样的自动注释工具来更快地完成这个项目。
自 COVID-19 爆发以来,人数统计解决方案越来越受欢迎,有助于执行社交距离规则并提高安全性。
这是一个推荐的数据集,可以帮助您入门:
接下来是一个简单的颜色检测器,您可以将其用于各种视觉任务。
从检测颜色到构建绿屏应用程序(用自定义视频或背景替换绿色背景)到简单的照片编辑软件,构建颜色识别器是开始使用计算机视觉的绝佳项目。
以下是您可能希望用于您的项目的一些有趣的数据集:
接下来,考虑承担更高级的计算机视觉任务——视频中的对象跟踪。
对象跟踪是关于从先前的信息估计场景中存在的目标对象的状态。
您可以使用涉及一个对象(例如汽车)或多个对象(例如行人、动物等)的视频来构建简单的对象跟踪模型。
本质上,该模型将执行两项任务——预测对象的下一个状态,并根据对象的实际情况纠正此状态。对象跟踪模型在交通控制和人机交互中找到应用。
以下是一些您可能会对此计算机视觉任务感兴趣的视频数据集:
建立一个物体检测模型来检测行人是最简单和最快的计算机视觉项目之一。
您只需要一个相关的高质量图像数据集和一个数据训练平台来训练和测试您的模型。您可以使用其中一种免费的图像注释工具或试用 V7。
行人探测器通常用于汽车行业的交通安全以及人机交互和智能视频系统。
考虑这些数据集以开始:
手势识别是一项更高级的计算机视觉任务,需要您首先将手部区域与背景分离,然后分割手指以预测手势。
如果您想保持模型简单或利用 V7 的关键点骨架和自定义多边形工具来使标记更快、更准确,则可以使用 OpenCV。
训练后,您可以使用网络摄像头测试您的模型。手势模型可用于 VR 游戏和手语。
查看这些数据集以开始使用:
如果您决定执行更具挑战性的任务,请考虑构建情绪检测模型。您可以基于六种主要面部情绪来构建模型:快乐、悲伤、愤怒、恐惧、厌恶和惊讶。
该项目的三个主要组成部分包括图像预处理、特征提取和特征分类。
以下是可能派上用场的数据集:
道路车道检测是另一种在汽车行业发展中发挥关键作用的计算机视觉模型。
道路车道检测器主要用于自动驾驶汽车,是一个有趣的初学者项目,可帮助您获得图像和视频的动手体验。
这里有几个数据集可以帮助你:
可以使用OCR(光学字符识别)技术开发名片扫描仪。您经过训练的模型将从名片中查找和提取信息。
本质上,这个项目将分为三个阶段:图像处理(降噪)、OCR(文本提取)和分类(分类关键属性)。
您可以使用名片阅读器自动输入数据。
选择其中一个数据集开始:
车牌识别器是使用 OCR 的计算机视觉项目的另一个想法。
然而,这个项目有两个挑战:数据收集和车牌格式的差异,具体取决于位置/国家。
因此,除非您训练大量数据(如果您设法获得它),否则您的模型可能不准确。
注意:车牌号被视为敏感数据,因此请确保在构建模型时坚持使用公开可用的数据集。
一个简单的自动车牌识别系统可以使用基本的图像处理技术,您可以使用 OpenCV 和 Python 构建它。
然而,更高级的系统使用对象检测器,如YOLO或 Fast C-RNN。
自动车牌识别可用于安防、停车、智慧城市、自动收费和门禁控制。
以下是您可能会考虑的一些数据集:
这个项目对于计算机视觉新手来说是一个完美的开始——你可以使用 MNIST 数据集构建一个简单的数字识别器。
当您有机会使用卷积神经网络训练模型时,您将学习如何开发、评估和使用卷积深度学习神经网络进行图像分类。
MNIST 数据集包含 60,000 个示例的训练集和 10,000 个示例的测试集。你可以在这里访问它:
这是另一个计算机视觉项目,它基于最流行且易于获得的模式识别数据集之一——鸢尾花分类数据集。
它包含三个类别,每个类别 50 个实例,其中每个类别指的是一种鸢尾植物。
这是一个很棒的初学者项目,可以帮助您获得图像分类的实践经验,因为您将训练您的模型来预测新鸢尾花的种类。
您可以在此处下载数据集:
抓取您的家庭相册收集原始数据并建立人脸识别模型以识别照片中的家庭成员。
您可以使用免费的注释工具或 V7标记您的数据,并在不到一小时的时间内训练您的模型。该任务是一个多阶段的过程,包括人脸检测、对齐、特征提取和特征识别。
为了使您的项目更有趣并且您的模型更准确,也可以考虑使用视频数据。
如果您无法自行获取数据,请查看这些数据集以开始使用面部识别项目:
如果您在童年时期曾花费数小时搭建乐高积木,那么这个项目可能是让您迷上计算机视觉的完美方式。
在最简单的形式中,您可以使用网络摄像头或手机摄像头构建模型来实时检测和识别乐高积木。您所需要的只是大量的训练数据和一个训练模型的工具。
以下是为您准备的数据集:
这个计算机视觉项目的目标是建立一个模型来识别 PPE 或面罩的元素。您可以在几个小时内完成它,并使用网络摄像头并在电脑前戴上口罩进行测试。
以下是我们如何在不到一分钟的时间内使用 V7 的自动注释工具标记工人 PPE。
PPE 检测模型可应用于建筑或医疗保健(医院)等行业。
查看这些数据集以开始使用:
与 PPE 检测类似,您可以构建一个简单的面罩检测模型来识别在公共场所戴口罩和不戴口罩的人。
请记住收集大量数据以确保模型在处理各种遮挡时的准确性。
查看此数据集以开始使用:
最后,考虑花一些时间训练交通信号灯检测器。这个项目相对容易完成,因为您可以免费访问数据和研究。
红绿灯检测在智能交通领域有应用,包括自动驾驶汽车和智慧城市等流行用例。
以下是您可以使用的一些数据集:
在此视频中了解V7 如何处理交通灯检测。
现在您已经对计算机视觉项目有了很多想法,是时候获得一些实践经验并开始开发自己的 AI 模型了。
如果你想让事情变得简单——从使用 Iris Flowers 数据集或行人检测的图像分类开始。