OpenMMLab AI 实战营 Day 1 笔记

A. 计算机视觉问题类型和应用

计算机视觉是一门让计算机学会“看”的学科,主要仍然是用CNN,DL等工具,数据驱动地完成训练。

主要能够完成的工作有识别,分类,定位,检测,以及他们的各种结合和细化。这里举几个有代表性的例子:

1.分类(识别图中物体)->定位(框选图中物体)->检测(框选图中不同物体)->分割(划分不同物体轮廓)

2.语义分割->实例分割->关键点定位。

关于应用,随着算法的更新换代(我就resnet熟一点,resnet是这类问题的算法的算力分水岭了),能做的事越来越多,准确度也越来越高,比如人脸识别,自动驾驶中的环境检测,图像生成,关键点识别,也可以用在视频中,实现对视频的自动剪辑。

B.OpenMMLab的介绍

关于发展,基本也是符合machine learning的发展节奏的。很期待之后能把ML的东西能用在计算机视觉上(我不是研究计算机视觉的,我曾经是搞统计的,对ML很熟悉但是对计算机视觉确实没什么具体了解)

因此至于OpenMMLab,我更愿意将其理解成ML领域很常见的tensorflow(才知道原来在计算机视觉里也很常见),是基于PYTORCH的框架,封装了一系列计算机视觉相关的强大计算工具,比如MMclasification(分类),MMDetection(检测),MMGeneration(生成)等。

相信这次有了超算平台的加持,应该能够更好地运用这些功能。

C.Machine Learning的内容

这部分介绍了机器学习中很基本的内容,包含分类器构建和改良--损失函数的最优化问题(这个我天天做,这里只介绍了最基本的gradient descent),CNN的结构(pooling,padding)等。

最后还包括了一些pytorch的基本内容,如何对pytorch进行部署。

你可能感兴趣的:(人工智能,计算机视觉,深度学习)