近几年,人工智能逐渐从理论科学落地到现实中。
大到火车站的人脸识别,小到手机里的语音助手,人工智能与生活越来越息息相关。
然而,随着人工智能应用场景的逐渐增多,人工智能出错的情形也开始频频出现。
近日,丰巢智能柜的刷脸取件就出现了被小学生破解的情况。
据央视财经报道,浙江某学校的小学生在课外实验中发现,只要用一张打印照片就能代替真人刷脸,从丰巢智能柜中取走父母的货件。
对此,丰巢回应称,该“刷脸”应用为试运营版本,已在第一时间下线。
不过,公众显然并不认同这种说辞,结合此前董明珠“闯红灯”的乌龙事件,一时间关于“人脸识别技术的安全性与实用性”话题再次成为社会关注的焦点。
△董明珠被“闯红灯”。实际是公交巴士贴着董明珠头像,刚好被摄像头拍到,人工智能系统误以为是董明珠闯了红灯。
很显然,类似情况的出现表明了人工智能在落地的过程中并不是一帆风顺,那我们不禁要问:是什么原因导致了人工智能在落地的过程中频繁出错,我们又该如何解决呢?
1.制约人工智能发展的关键因素
随着深度学习和神经网络的挖掘,越来越多的人工智能技术被应用到日常的生活中,人工智能开始从一个概念性的名词,渐渐地转变成为了能够实现商业化推广的落地应用技术。
在人工智能脱离实验室走向实际场景的这一过程中,数据服务行业逐渐从幕后走到台前,成为这一过程之中最隐秘的见证者。
事实上,数据服务行业在此前的被重视程度是远远不如算法、算力领域的,甚至有一种论调认为:“非监督式学习,闭环学习等等无需大量数据就可以达到同样效果的方式才是人工智能学习的未来。”
然而,事实真的如此吗?
举个简单的例子:“几年以前,标注员只需要在人脸上标注几个点就可以了,但是现在面部关键点标注需要206点:每个眉毛上8个,嘴唇个20多个,脸颊17个等等,对于标注数据的精确度也提高到了一个新的要求。”
目前,国内外很多专家学者都表示就当下人工智能的发展阶段,数据数量和数据质量能够直接决定人工智能在识别结果上面的优劣。
数据,显然已成为制约人工智能发展的关键一环。
2.何为数据标注
在了解数据标注之前,我们需要明白一个准则:在通常情况下,人工投喂数据的质量往往直接影响着智能的精度。
那么,人工投喂的数据从何而来?答案是:数据标注。
简单来说,数据标注是通过数据标注员借助标注工具,对人工智能学习数据进行加工的一种行为。数据标注有很多类型,如分类、画框、注释、标记等等。
可以说,数据是人工智能的基础,而数据标注则是人工智能落地的坚实后盾。
3.数据标注进入精细化时代
长久以来,数据标注行业被外界认为是人工智能金字塔上最底层的工作。
此前,经常有报道称某某人工智能公司把数据标注的服务外包给非洲公司,甚至有媒体在探访非洲数据标注工厂后感叹:“贫民在为硅谷人工智能打工赚钱。”
不过,随着当下人工智能行业对于标注数据质量要求的越来越高,数据标注行业逐渐迈向精细化时代。
小到用数据爬虫抓取互联网现存数据,并进行拉框,大到根据用户定制化的硬件以及场景需求,去完成数据的采集与多维度数据标注。数据标注行业,如今正朝着专业化、细分化、场景化的方向不断演进。
行业需求的变化,也催生了业内企业的优胜劣汰。一个最简单的例子就是,如果是人脸检测,那么利用拉框标记就可以很快满足需求。但随着专业人工智能公司要求的提升,人工智能已经不再仅仅是做人脸检测,而是视线追踪、或是微表情检测等。很显然,这类需求很难通过互联网或者众包用户采集完成。
理念更先进、技术更硬核、服务更专业的人工智能数据服务企业才更加符合人工智能行业精细化运营时代的需求。话句话说,高质、精准的数据才是人工智能行业的未来。
专业数据公司对于数据服务行业的预测也完全符合这种观点。据艾瑞咨询最新报告显示,2018年中国人工智能基础数据服务市场规模为25.86亿元,其中数据资源精准定制服务占比86.2%,行业年复合增长率为23.5%,预计2025年市场规模将突破110亿元。
很明显,数据服务行业未来更加欢迎高质量的数据服务企业,数据标注将脱离刀耕火种,进入精细化运营时代。
在数据标注这片蓝海市场中,未来机遇广阔,淘汰也在持续进行,但可以肯定的是专业化、场景化、定制化将成为行业未来发展的主要趋势,构筑起数据服务行业新的未来。