1.什么是计算机视觉
通过机器模拟人类视觉系统,采集、处理、分析视频图片素材,提取并理解场景信息。
2.行业&产品分布
目前CV的落地主要集中在安防、医疗、零售、自动驾驶;在互联网短视频、物流、智能教育几个行业也有少量对特定场景的解决方案。
2.1 行业调研
2.1.1 行业概况
17年,人工智能市场规模237亿,CV占了34.9%。
其中67.9%的营收都是安防领域贡献的,18.1%来自广告营销。
目前依然是安防占据了CV市场结构中的大头,这可能和行业特点、硬件/算法发展路径有关。
相比其他传统行业,安防行业有更强的"鉴定身份"需求,场景从最初的 1.1v1,1vN,指纹比对 2.身份证人脸比对 到最新的 3.静态人脸自动检测 4.动态人脸检测&对象行为轨迹分析 5.智慧案情分析 发展方向从单纯的鉴定身份,逐渐到后续更多的业务场景。
2.1.2 计算机视觉的行业应用
整理18年1—8月人工智能创业公司融资信息,找出最新的行业落地方向,分析产品竞争力。
18年上,融资的创业公司共199家,计算机视觉通用服务方向有36家,和CV有关的30家。
落地行业,按企业数量排序为:医疗、零售、工业检测、智能驾驶、智能教育、安防,其中有专注底层技术,提供多行业解决方案的,比如商汤、旷世,也有聚焦一个行业的,比如哈哈零售、一脉阳光。
医疗:基于计算机视觉技术的,智能CT、智能X线辅助筛查,辅助放射科医生诊断病情,除了初步的辅助诊断病情,还有针对医学痛点的其他AI方案,例如推想科技提供的医疗深度学习平台,药物研发深度学习平台等。运营模式上,基本都是和医院合作,提供智能诊疗系统。行业的难点在高质量数据难以获得,业务场景相对复杂,需要有专业医学背景的标注人员。
零售:提供基于计算机视觉的无人货架方案,自动识别用户拿走的商品,另外根据人流分析、商品销售情况,输出一整套 供应——>运输——>销售数字化方案。
工业检测: 提供基于深度学习的外观缺陷视觉检测、精确测量技术设备,目标行业是手机加工,汽车,3C等,价值在提高企业的加工环节的自动化率,降低人工成本、提高产品质量。
智能教育:和CV相关的,机器阅卷。
根据对AI影响比较重要的几个因素,算法、数据、落地场景,将相关公司分为几类
诸如顺丰、头条类公司,有丰富的数据积累,通过算法,输出AI方案,解决自己业务的痛点。
还有和第三方传统行业龙头战略合作,抱大腿接需求,专门解决对方业务痛点的,例如极视角和华润战略合作。
最后附一张,头部CV公司在各行业的产品布局。
2.2 产品调研
2.2.1 腾讯觅影
背景:看病流程可以简化为三个步骤,诊前:日常的运动、大保健,对疾病预防。 诊中:智能分流——>辅助诊断——>药方建议。诊后:保养,其他不在主流程里的还有药物研发、医生学习等。
观察整个诊疗过程,有图像产生&高重复性&人工大量集中的环节,主要在诊中,腾讯觅影提供辅助诊断的能力,也是在诊中环节,针对病人CT/X光,给医生提供可能疾病的建议,对医生提效的同事,也提高了初中级医生的判断能力。
从腾讯觅影的官网看,目前能够提供包括肺癌、食道癌等6个癌症的诊断能力,检出率or准确率,都能做到90%以上。
从医院公告来看,主要扮演提醒者,辅助医生作业。
2.2.2 鲁班智能设计平台
场景很明确,设计电商banner,初期是辅助,后期替换。
四个核心生成步骤:
一,让机器理解设计是什么构成的:通过人工数据标注,对设计的原始文件中的图层做分类,对元素做标注。设计专家团队也会提炼设计手法和风格。通过数据的方式告诉机器这些元素为什么可以放在一起,我们把专家的经验和知识通过数据输入。这部分核心是深度序列学习的算法模型。
第二步,建立元素中心:当机器学习到设计框架后,需要大量的生产资料。我们会建立元素库,通过机器做图像特征提取,然后分类,再通过人工控制图像质量以及版权问题,我们买了有版权的图库,也是希望从一开始就避免版权方面的纠纷。
第三步,生成的系统:原理有点像 Alpha Go 下围棋。我们在设计框架上构建起虚拟画布,类似棋盘,生成的系统把元素中心的元素往棋盘放,在这里我们采用了“强化学习”,就好像你在家里放一台扫地机器人,让它自己跑,跑个几圈,它自己会知道哪里有障碍要避开。在强化学习的过程中,机器参考原始样本,通过不断尝试,得到一些反馈,然后从中学习到什么样的设计是对的、好的。
第四步,评估的系统:我们会抓取大量设计的成品,从“美学”和“商业”两个方面进行评估。美学上的评估由人来进行,这方面有专业众包公司;商业上的评估就是看投放出去的点击率浏览量等等。
2.3 调研结论
从各创业公司的产品分布看,目前有三种模式
1.头部创业公司,竞争力在维持技术优势,未来有新的行业方向,第一时间切上去,因为技术优势,所以哪怕发现晚点,也可以快速形成自己有竞争力的方案。
2.利用行业资源,垂直做一个方向,算法可能不占优势,但因为竞争力在于资源,可以保证产品快速落地,积累资源、数据优势。
3.做方案商,自己没有数据、算力,输出算法能力,抱住一两个传统行业的大腿,接需求,对自己没有沉淀。
2.4 CV的机会怎么找
目前看,CV价值在两方面
1.替换辅助人工,业务提效
人能做的机器也能做,主要收益在提效,对应鲁班、机器阅卷、人脸监控、无人货架都是解放人力,提高效率。
具体是替换还是辅助,看场景的业务难度。
2.创造新的场景体验
人脸远程比对、视频广告、AI美颜,处理海量数据+低延时要求,人做不了,得靠机器,创造了新的场景和用户体验。
1. 找重复性人力集中的地方 2.找图片/视频和用户交叉的地方。