【计算机视觉】近期问答整理及干货分享

最近关注公众号的朋友越来越多啦

也很开心能和大家一起交流

整理了一些最近问答的内容和学习的干货,希望有同样心得的朋友也能多多发表自己的意见~

Q:计算机视觉领域产品如何比较评估?

(人脸识别举例)

我的回答:

没有给具体场景这个问题还是比较难回答。人脸识别的产品也很多,我们简单分为两大类吧:

1.移动端的人脸识别:包括刷脸支付等等

2.硬件终端的人脸识别:比如应用于安防行业的人脸识别。

通常应用于终端的人脸识别挑战更大,因为摄像头像素、拍摄角度、光线、网络等等因素都会影响到人脸识别这个产品的效果。

先概括这两类的共通点:

从算法模型角度评估

a.准确率和召回率,对比理解,详见下图


【计算机视觉】近期问答整理及干货分享_第1张图片

b.响应速度:识别人脸的速度?

c.切换场景下模型表现程度:移动端识别效果、摄像头识别效果、模糊识别效果?

2.产品角度评估

人脸识别产品不只是包括人脸识别,人脸能够识别的前提是要人脸录入。人脸录入的质量直接影响到了人脸识别的效果。

1)人脸录入评估

a.便捷性:web录入还是app录入,支不支持导入?

b.用户体验:录入成功需要多久?引导过程是否流畅

c.严格程度:需不需要活体检测?是否需要正面、侧面、上下面的数据

d.数据可用性:录入的数据有效比例?

2)人脸识别系统评估

a.系统架构评估:网速对系统的影响非常大,因此基于需求选择是局域网还是互联网。系统架构直接影响到了开发难度。

b.系统功能性评估:系统可用性可否高,识别引导界面是否人性化

c.系统稳定性

不共通的:

对于第二类在工业上应用的人脸识别还有一个重要问题是“数据”,这些数据的保存期限、大小、备份方式等等都是在竞标的时候需要考虑的因素。评估人脸识别产品,这个也是必不可少的一项。

怎么去比较、选型人脸识别产品?

1.如果是你的产品需要结合人脸识别功能,选人脸识别产品就是选模型而已。根据这个功能使用场景关注就好,准确率、召回率、速度不可忽视。

2.如果你需要选型已经集成好了的人脸识别摄像头或者摄像头+服务器,需要考虑的因素就太多了。摄像头设备选型、产品效果、成本,这个产品会不会受其他系统影响,甚至就连这个产品的售前售后是否令人满意都需要考虑。产品选型需要深层次考虑到场景和需求,比如在机场的人脸识别产品选型就和街道的人脸识别产品选型不一样。

黄钊的补充

1、人脸识别是一个很重要的领域,里面有很多非常“碎”的识别项。比如

1)人脸检测。通俗的讲是“识别出人脸”(并不包含识别出“这是谁”,后面会说)。相对正式的描述是“在静止图像或者视频流中,人脸检测技术能快速准确地检测出多张人脸的位置”。

2)人脸身份识别。通俗的讲是“识别出这是谁”。相对正式的描述是“对RGB图片框选的人脸,计算出人脸128维特征描述,并与数据库中的描述比对,计算出人脸的身份”

3)人脸性别识别

4)人脸年龄识别。准确识别出多少岁比较难。常见的是识别初某个年龄段。

5)人脸表情识别。比如识别出指定的N种表情类型(平静、高兴……)。

6)人脸追踪。人脸检测后,对移动中的人脸进行跟踪,保证能够对视野内人脸的移动轨迹做高速和连续的追踪和定位。

……更多的,大家可自行查资料,或者等实战的时候结合工作需要来理解。比如最近百度有宣传过下图

需要说明的是

1)以上识别项,一般还会分“离线/在线”,比如离线人脸表情识别/在线人脸表情识别,是不同的2个指标。

2)旷视科技CEO印奇最近刚公开分享:在金融安全领域,一开始我们认为人脸识别本身是最重要的技术,但随着对行业的深入我们发现活体技术(如何验证这是一张真人的脸,而不是一张照片或者视频)和防欺诈技术才是戳中用户痛点的、更本质的关键。而我们对这个行业问题本质的定义是基于深扎到这个行业和场景之中不断的实践才能得出的。”

2、评价算法性能的4个向度

1)准确率(所有人关注的)

2)误报率

3)计算成本/响应速度

4)特异性/通用性

每个产品对算法偏好有具体的要求,需要在至少16种特性组合中选取一种最适合产品的算法;通用测试结果好的算法未必适用于特定场景;所以产品定义必须先于算法研发(以人脸检测为例)。

“产品定义”,包括但不限于

--对摄像头信噪比是否有要求?

--对摄像头对比度是否有要求

--是否要求抗遮挡

--是否要求抗运动模糊

--是否要求抗光照变化

--是否要求观察角度

--是否要求处理侧脸

3、测试环境需要说明,比如

CPU:Intel(R) Core(TM) i7-4790 CPU @ 3.60 GHz

内存:8GB

系统:Ubuntu 14.04 x86_64/Windows 7 SP1 64bit

GCC版本:4.8.2

注:以上测试环境是PC,也可以在手机上。

Q:产品经理在AI项目里的价值?

(图像识别)

我的回答

AI产品跟业务产品很不一样的是AI产品不再局限于界面功能设计。

AI产品更加注重逻辑效率

举一个简单例子,如果现在有一个产品,主要功能是在Web上识别用户上传上来的图片。

我们知道整个业务流程是非常简单的,页面功能上就是上传按钮、图片展示、识别结果展示以及各种非正常提示等,其实这些设计是跟以往的产品没有任何区别的。

但是作为一个AI产品(已经可以这么简单理解了),更应该关注:

识别结果的时间(排除网速的因素外,针对图像检测、图像识别、结果返回的各个时间段)

识别效果(精确率和召回率,这个算法会跟,但是产品也必须清楚,甚至以市场均值倒逼算法)同时跟踪识别优化方案

产品种类(比如你的产品只能识别人,但其他产品可以识别男人、女人等等)

产品结构(知道数据是怎么流的,每一次数据识别图片放哪儿?结果放哪儿?)

客户反馈(这是做任何产品都要关注的)

除了这些还有很多可以考虑的:比如了解什么时候换模型?这一次模型优化的地方?模型是否对所有客户都有效用?如果本次模型表现不佳是哪些数据问题还是算法网络问题等等?还可以从项目落地考虑现有产品是否有更多的落地场景。如果贵司的产品有跟硬件结合那操心的事更多了,也更加和界面脱离关系。

计算机视觉干货文章分享

计算机视觉

1.《计算机视觉基础概念与模型WalkThrough》

地址(复制到浏览器打开):http://www.jianshu.com/p/bf7260f82efa?utm_campaign=hugo&utm_medium=reader_share&utm_content=note&utm_source=weixin-friends

下图是我总结本文的脑图,可以说是除了干货还是干货了。


【计算机视觉】近期问答整理及干货分享_第2张图片

2.《浅谈计算机视觉的应用与发展》

地址(复制到浏览器打开):http://www.jianshu.com/p/a46acf46ac76?utm_campaign=hugo&utm_medium=reader_share&utm_content=note&utm_source=weixin-friends

3.【万字实录】商汤徐立:计算机视觉的完整链条,从成像到早期视觉再到识别理解

微信公众号:将门创投

4.【万字实录】格灵深瞳赵勇:计算机视觉在安防、交通、机器人、无人车等领域的应用

微信公众号:将门创投

人脸识别

1.《百度大脑人机大战险胜,我们来聊点干货:人脸识别的原理》

36kr 地址(复制到浏览器打开):https://36kr.com/p/5061491.html

2.《实时人脸检测 (Real-Time Face Detection)》

地址(复制到浏览器打开):http://www.jianshu.com/p/84baa04058e5?utm_campaign=hugo&utm_medium=reader_share&utm_content=note&utm_source=weixin-friends

3.《人脸识别概述及识别的基本方法流程》

http://www.360doc.com/content/11/1101/19/3054335_160896162.shtml

4.CSDN 里的一类文章合集:

《走近人脸检测(1)——基本流程》

文章地址(复制到浏览器打开):http://blog.csdn.net/zchang81/article/details/71515442

《走近人脸检测(2)——VJ人脸检测器及其发展》

文章地址(复制到浏览器打开):http://blog.csdn.net/zchang81/article/details/71515490

《走近人脸检测(3)——R-CNN 系列》

文章地址(复制到浏览器打开):http://blog.csdn.net/zchang81/article/details/71515529

《走近人脸检测(4)——传统人脸检测技术和 CNN 的结合》

文章地址(复制到浏览器打开):http://blog.csdn.net/zchang81/article/details/71515554

图像检索

1.图像搜索的前世今生,让你买买买停不下来的淘宝是如何做到所拍即所得的?

微信公众号:将门创投

2.机器学习和深度学习资料(推荐)

地址(复制到浏览器打开):http://www.jianshu.com/p/7dc232c1a3ff?utm_campaign=hugo&utm_medium=reader_share&utm_content=note&utm_source=weixin-friends

我是在AI道路上不断探索的一名产品

和我一起不断进步

【计算机视觉】近期问答整理及干货分享_第3张图片

你可能感兴趣的:(【计算机视觉】近期问答整理及干货分享)