人工智能走向更智能,需过“数据关”

在数字经济下,人工智能作为第四次产业变革的引擎,已逐渐渗透到各行业中,为人类社会和经济发展带来变革。不过,人工智能与数据息息相关,受到数据约束。人工智能产品的落地和聚焦领域的细分化,都对数据采集和标注提出了更多挑战。

“一般大家都会低估人工智能(AI)的能力,其实人工智能可以比最聪明的人还要聪明。我希望AI会是好东西。”

“我觉得 AI 能够给全世界打开一个新的篇章,让大家更好地理解自己,而不是完全理解外部的世界。我不认为AI是一种威胁,人类可以控制人工智能。”

近日,联合国数字合作高级别小组联合主席马云与特斯拉首席执行官马斯克一场别开生面的“双马”对话引爆人工智能行业。双方争执的焦点莫过于:AI与人类究竟谁更聪明,AI到底能不能威胁到人类?

在业内人士看来,马云与马斯克,一个更关注现实问题,一个对未来更有热情,这与二者所接触的文化有关,也与他们所从事的领域有关。

北京云测信息技术有限公司旗下AI数据服务品牌“云测数据”总经理贾宇航表示,目前,AI只是处于“弱智能”阶段,且大多只聚焦于某一领域,通用型的AI尚处于研发阶段,而且高度智能的“强智能”阶段是否会到来、需要多久才能到来,一切尚都是未知数。在他看来,人工智能短期内一定会代替部分重复性劳动。他认为,AI本身其实带有一种温情和关怀,因为它代替的是高危和重复性劳动,这会节省很多人类的时间,让人与人之间的交互模式产生很大改观。而当前人工智能亟待突破的一大瓶颈就是数据。

AI深入发展  对数据质量要求渐高

在数字经济下,人工智能作为第四次产业变革的引擎,已逐渐渗透到各行业中,为人类社会和经济发展带来变革。不过,贾宇航表示,人工智能目前也面临一些挑战。如数据量尤其是专用领域的数据数量和质量不够,硬件工程化成本相对较高,缺乏应对场景等。
  
  “人工智能的背后有数据、算法和算力来支撑,这三要素之间其实是一种相互促进,并且也相互制约的关系。”贾宇航表示,当下人工智能爆发的原因,主要是由于深度神经网络的提出、整个算力的提升,以及互联网中存在的大量数据可以被利用,大大降低了数据获取的门槛。其中,数据是人工智能发展的基础,没有数据,再强的算法也不可能有好的模型。
  
  “人工智能产业化落地的关键就在于数据,算法模型做得再好,数据从源头上就错了,那就得不到正确的训练成果。”一位业内人士表示。
  
  中山大学数据科学与计算机学院教授、广东省信息安全技术重点实验室主任赖剑煌也表示:“我们要正确认识目前的人工智能技术,这波人工智能技术不是可以做任何没有约束的事情,它是有局限的,人工智能与数据息息相关,它受到数据约束,产业应用要跟场景结合,一定要有落地。”
  
  贾宇航表示,现在很多AI产品都处于落地阶段,对于模型的精确程度要求非常高,对应的要求数据的精度也就非常高了。而且为了提高模型识别精度,AI公司用到的数据也从单一化向多模态转变。以自动驾驶为例,从最早基于摄像头做感知的方案,到引入激光雷达,到之后可能会引入更多其他感知设备来提升感知算法。未来多传感器的解决方案将会普遍应用到我们所使用的AI产品中,它的感知模式将不仅仅是基于单一的图像、声音或文字,将会引入更多模态的数据。
  
  “这种数据互联网中没有,就需要专业的数据公司在对应的场景下进行采集,然后进行高精度的标注。”贾宇航介绍说,为了算法的提升,AI企业不仅需要定制化的数据采集来获得长尾场景的数据;同时对于标注数据的精度也需要进一步提升。

AI聚焦领域细分化  数据服务再迎挑战

当前,人工智能已经逐步走进人类生活,从车辆自动化驾驶到AI聊天机器人,从医学成像与诊断到农作物监测,作为人工智能三要素之一的“数据”也正在其中发挥着不可或缺的作用,精准高质的数据已成为引领人工智能发展的重要战略窗口。
  
  随着应用场景的不断挖掘,贾宇航分析认为,整个人工智能行业未来会出现聚焦领域越来越细分化的趋势。
  
  从科技部近日公布的新一批国家人工智能开放创新平台名单中也可以看出这一趋势。
  
  新一批国家人工智能开放创新平台名单总计有10家企业入围,分别为京东、华为、小米、360、依图、明略科技、中国平安、海康威视、旷视、好未来。相较于2017年名单中的5家企业(阿里云、腾讯、百度、科大讯飞、商汤科技),此次名单的发布意味着人工智能“国家队”正在快速扩容。同时,从每家企业的入围业务也可以看出,国家人工智能开放创新平台正在加速开展细分领域的技术创新。如名单中显示,依托京东集团建设智能供应链人工智能开放创新平台,依托小米公司建设智能家居人工智能开放创新平台,依托华为公司建设基础软硬件人工智能开放创新平台等。
  
  人工智能聚焦的领域越来越细分,也给数据服务行业提出了挑战。
  
  “人工智能技术要落地,必须找到相应的应用场景。相对应的,我们数据服务行业的从业人员就要很好地理解客户的应用场景,要有相关领域专业知识的积累,包括在标注工作中对于一些细节要有很好的理解,对用户需求要有很好的理解,这是一种很高的门槛。”贾宇航说,未来数据服务行业将越来越需要更多专业人士参与数据采集和标注,从业人员需要与各个领域的专家进行协作和融合。
  
  另外,贾宇航认为数据安全也是推动人工智能持续健康发展的关键。“企业拥有数据其实就可以帮助他构建他的核心壁垒。比如有了某一场景下的数据,对应的AI产品就能发布了,有了高精度的数据,AI算法就能提升了。所以,我们的数据是绝对不能泄露出去的。我们内部有数据隔离、质量保障等一系列保护数据安全的方法,可以在确保企业数据安全的情况下,持续为数据采集和标注构建和优化自己的方案。”
  
  在贾宇航看来,AI最终是为了落地、为了被使用,所以对于AI所需的数据质量要求会更高更精准、会有更多的定制化场景下的数据需求,在提高数据安全与隐私保护之外,保证数据的惟一性、场景化,才能真正帮助企业打造数据核心壁垒,大幅度推动AI进一步落地,这也是云测数据一直赋予自身的“使命”。


如果你有人工智能相关的数据采集与标注需求,欢迎联络云测数据,可以添加微信 LinuxNews,或扫码联络:

人工智能走向更智能,需过“数据关”_第1张图片

云测数据官网:https://www.testin.cn/business/ai/index.htm

你可能感兴趣的:(人工智能)