第2周AI学习笔记(1.8-1.14)

首先总结一下上周计划完成情况:

1、对计算机视觉某一具体技术从底层到应用弄懂,并找到一个对应的行业应用

学习内容为人脸识别整体流程中的第一步——人脸检测,包括滑动窗口范式基本实现流程、VJ人脸检测器极其后续的R-CNN等算法,主要参考了CSDN上几个技术博主的文章。原计划打算把学习的内容以文章的形式记录下来,整合一下形式发给团长说不定还能被发出来,不过着手开始写的时候就觉得了解的不够。(想起大学教我吉他的学长说过几句话,如果要上台表演一个曲子,台上的表现如果要达到8分,那台下练习至少要10分才行)。

没有用文章记录的另一个原因是,我有点动摇学习的方向,是不是计算机视觉这个方向是合适的,相比之下,知识图谱、推荐系统、NLP这些是不是更有价值与效率。最后的结论是,继续当前的方向钻研一定的深度再说,相信不同的领域都是有一定共通性的。

行业应用没有仔细去研究,这点其实很容易但是没有做到,需要反省。

2、看完《科学的极致》。

这点有点判断失误,高估了自己,低估了实际的干扰程度。只完成了10%左右,整本书还剩40%左右。

计算机视觉主要学习内容:

1、相似概念:计算机视觉、机器视觉、图像处理

2、开源框架及深度学习开源学习库

3、CNN卷积神经网络适用于图像识别和音频识别,

4、RNN循环神经网络(如LSTM)

5、图像识别细分应用:图像特征、图像分类、图像检测、图像分割、图像描述(静态和动态)、图像问答、图像生成、图像检索

这里列出的每个细分技术都可以研究很久了,人脸检测还只是图像检测中的一个类别,任重而道远啊。

6、衡量人脸识别算法能力的指标:拒识率、误识率、通过率、准确率。容易误解的概念,precision/recall

人脸检测主要学习内容:

1、图像识别>图像检测Image Detection>人脸检测/face detection

2、人脸检测的主要任务——判断给定的图像上是否存在人脸,若存在,则返回人脸所处的位置及大小,一般是坐标的形式。

3、滑动窗口范式的步骤,图像金字塔(Gaussian 金字塔 和 Laplacian 金字塔)

4、Viola-Jones人脸检测器的三个部分——积分图、分类器AdaBoost、级联结构的设计

5、Haar-like特征

下周学习计划(这次要保守一点,不要那么激进了):

1、《科学的极致》至少继续再阅读10%

2、继续学习人脸检测,特别是一些比较前沿的内容。把学习内容输出为文章,如果质量可以,可以发送给团长寻求指点。

3、公司有个只能切图的项目,想一下可以应用的点。

以上三点。

你可能感兴趣的:(第2周AI学习笔记(1.8-1.14))