近日,由中国计算机学会(中国计算机领域最权威学会)、中国中文信息学会(人工智能自然语义理解最权威学会)和百度公司联合举办的“2019机器阅读理解竞赛”完美落幕。经过全球2502个团队长达2个月的激烈角逐,深思考人工智能在两项评测指标中均登顶全球榜首,成功夺取全球冠军。
机器阅读理解(MachineReading Comprehension)是指让机器阅读文本,然后回答和阅读内容相关的问题。阅读理解是自然语言处理和人工智能领域的重要前沿课题,对于提升机器智能水平、使机器具有持续知识获取能力具有重要价值,近年来受到学术界和工业界的广泛关注。
作为中文机器阅读理解权威赛事,“2019机器阅读理解竞赛” 重点关注当前优秀的阅读理解系统尚不能正确回答的问题,全面评测机器进行深度语言理解以回答复杂问题的能力。
值得一提的是,在2018年的“机器阅读理解大赛”中,深思考人工智能同样在1600多支国内外参赛队伍中脱颖而出,排名第三,获全球大奖。此番再夺大赛桂冠,一方面证明了深思考在全球机器阅读理解领域的前沿实力;另一方面,大赛在极大地推动阅读理解技术进步的同时,也将深思考这家以研发为主、不断布局场景落地的创业型公司更多的展现在全世界面前。
以技术驱动——深思考人工智能
深思考人工智能(iDeepWise Artificial Intelligence)成立于2015年,是一家专注于类脑人工智能与深度学习核心科技的AI公司。核心团队由中科院自动化所、软件所、计算所、微电子所等中科院院所、清华大学一线青年AI科学家(博士10名)与领域顶级专家、营销专家组成。
作为一家技术驱动型公司,公司自主研发的“多模态深度语义理解引擎(iDeepwise.ai)技术”,可同时理解文本、视觉图像背后的语义。其中,对长文本的机器阅读理解技术、自由跨域的多轮人机对话技术、对多种模态信息的语义理解技术是其非常突出的优势——这也是深思考能够连续斩获“机器阅读理解大赛”国际大奖的原因之一。
“机器翻译准确度90%以上,万字翻译只需5秒钟”,或是“语音识别准确度超过98%”,这样的描述,代表着人工智能正在快速发展,图像和语音识别的准确率正在飞速提升。
但这距离真正的人工智能,仍然有不小的距离。尤其是在人工智能落地的场景之中,光靠图像识别的“看到”,和语音识别的“听到”是不足够的。
“人类说话的时候,往往是口语化的、不连续的、支离破碎的,甚至语序颠倒的。语音识别只停留在语音指令,不能理解用户语言及背后的逻辑,实际无法解决用户在很多场景中的刚需。”深思考创始人兼CEO杨志明博士表示。
他以生活中的对话场景举例。
比如用户对着家里的空调说,“请把空调调到28度”,这时几乎所有的空调都能够完成这样的指令。
但是如果用户对空调说,“我有点热了,把空调调低一点,调到我习惯的温度”,这时候语音识别就不能解决问题。这背后就有两层逻辑,第一,用户觉得热了,应该把空调打开,第二,就是调到用户平时习惯的温度,即存在个性化设置,机器需要理解用户语言背后的意义。
这个时候,深思考的“多模态深度语义理解引擎技术”就体现出了它的优势。
通过上下文的指代消解、意图理解、对话管理等技术,深思考多模态深度语义理解技术不仅提升了机器阅读理解的能力,还为更多行业解决方案的落地,提供了有效的产品支持。
以车联网场景为例,传统智能车载系统,通常通过驾驶室的智能语音交互屏幕实现人机互动。但随着座舱的发展,如今的驾驶室不再是一个简单的驾驶室,而是汽车行驶过程中的中央多模态信息的汇聚地。比如智能车联网场景下,汽车跟道路基础设施之间、汽车跟汽车之间、汽车跟互联网之间都能够做信息的连接和交互。车辆本身也通过视觉对车外的环境做感知与理解,再加上温度传感器、语音信息输入传感器等。
在智能车联网有很多模态的信息,有手势的模态、语音的模态、图像的模态。数字化场景下,深思考多模态深度语义理解技术,就能为对上述多模态信息进行综合理解,为人车交互提供智能大脑。同时,还可以在座舱环境下,实现人、车和家庭的连接。
再加上RPA自动软件机器人,不光可以实现人车对话,车辆还可以自动帮助驾驶员完成任务,比如预定会议室、与其他智能设备的联动、执行等。
“比如看一个电视剧,眼睛看画面、耳朵听声音、眼睛看字幕,对不同事物不同状态,人脑可以同时做理解。但AI还停留在识别与感知阶段,人脑更多是语义理解,而且是多模态理解。”杨志明在去年的一次分享中提到,模拟的人脑举一反三,在目前AI小的计算资源下快速和低功耗的运行,是深思考致力解决的类脑AI技术。
作为人工智能研究中最难的部分,语义理解技术的发展,让机器有了更强的阅读理解能力,这也让未来人机交互有了更多可能性。
“最新语义理解的技术,可以像人一样,看完一本书以后,问你这本书里面的问题。它对这本书里面的非结构化的信息进行多模态理解以后,可以像人脑理解以后再回答问题。”杨志明在采访中提到,人在看完一本书回答问题时,不会先整理出问答对或者知识图谱,而是凭借大脑的理解,直接回答别人的问题。
目前,深思考所研发的技术已经具备了上述能力。通过非结构化、长文本的机器阅读理解,避免了传统语义理解或者智能客服,用大量的人力物力去构建知识图谱或者问答对。而借此,深思考能让语义理解,像语音识别和图像识别一样,进行大规模的商业化场景的落地。
梦不止“夺冠”——深思考实现多种应用场景落地
目前,深思考主要落地于智能车联网数字座舱、汽车智慧营销、手机智能移动终端、智能家居、智慧医疗健康等应用场景。合作客户包括奇瑞、华为、九阳、小米、上汽、科大讯飞、浙大一院、复旦大学附属肿瘤医院等。
主要应用场景包括:
智能车联网数字座舱场景:在智能车联网数字座舱场景下,深思考基于多模态深度语义理解与人机对话引擎(iDeepWise.ai),提供具备智能车联网数字座舱内外的多模态信息(语音、文本、视觉)感知与理解、v2x信息感知与理解、终端多模态深度语义理解AI DPU芯片边缘计算等三大核心能力的“多模态语义理解与人车交互大脑”(iDeepWise.ai.car) 的AI SaaS 服务。
iDeepWise.ai具有多轮跨域的上下文理解能力,机器具备了上下文的“记忆力“及个性化交互和理解能力,最终建立起汽车与家、汽车与人、人与家之间的信息纽带,实现多场景融合的一站式AI服务。
深思考核心产品:多模态深度语义理解技术
汽车智慧营销场景:深思考提供汽车销售场景的多模态信息进行深度语义理解与人机对话iDeepWise.ai.sales 的AI SaaS 服务,从而帮助汽车大客户从多维度追踪和分析潜在用户,提升订单转化率,打造大规模购车人群大数据入口。
手机智能移动终端交互场景:深思考提供出行、健康咨询、智慧办公、休闲娱乐等场景的智能人机对话交互iDeepWise.ai.mobile 的AI SaaS 服务。尤其在出行领域,为2亿智能终端用户提供一站式AI智能出行生活服务,包括通过人机对话自动完成预订机票火车票、自动完成酒店预订等服务。
智能家居人机交互:深思考提供智能音箱、智能家电等家庭内多模态信息的语义理解与人机对话大脑iDeepWise.ai.Home AI Saas服务,实现家庭内家居设备对话式的简便操作、音影娱乐、营养健康饮食推荐建议。
智慧医疗健康:深思考基于多模态深度语义理解与人机对话引擎(iDeepWise.ai),提供对于病理细胞的视觉语义理解的产品ideepwise.AICIAS与人机对话式的健康咨询的AI Saas服务,其中人工智能辅助阅片系统(ideepwise.AI CIAS)帮助医生对宫颈细胞进行筛查与诊断,降低病理医师工作量及工作强度,提高宫颈癌筛查效率和诊断准确性,可以实现对宫颈癌的大规模筛查服务;其中人机对话式的健康咨询AI服务可以让人们通过人机对话实现妇婴、慢性病等的健康营养的权威咨询。
实际上,人工智能之所以成为当下的风口和热点,最根本原因就是在于人工智能的应用场景开始持续落地——这让人工智能的商业想象史无前例地提升和放大。
作为人工智能多模态深度语义理解技术领域的佼佼者,深思考通过不断的多场景落地,也证明着人工智能的明天值得我们万分期待。