4月10日,量子位与中关村壹号联合主办的AI+线下沙龙—智慧城市的发展趋势与挑战在中关村壹号举办。
思必驰CMO龙梦竹、明略科技COO兼数字城市发展部总经理唐日新、旷视产品营销总监吕盟、澎思科技公共安全业务部总经理茹敏、银河水滴战略合作总监张曼等人出席活动并带来精彩分享。
思必驰是中国智能语音行业新秀领军企业,拥有从感知到认知的完整人机交互技术链条。自主研发了对话操作系统(DUI)和人工智能芯片(Taihang)。面向智能终端市场,提供软硬一体化的语音交互产品与解决方案;面向企业市场,提供全渠道智能客服方案和虚拟助理机器人。
龙梦竹,思必驰CMO,智能硬件物联网资深人士,英特尔全球AI推广大使,在多个人工智能创新项目中担任导师。负责思必驰语音技术全方位的市场渠道合作,专注智能语音技术在智能硬件市场的应用方向和前沿发展,擅长整合行业资源和市场需求分析,对语音技术的运用领域和交互体验有非常深刻的理解。
以下是龙梦竹分享实录:
我们现在谈到智慧城市的时候,更多会想到安防、大数据、数据平台、数据共享等等,但其实智慧城市从空间理念上来讲,它是智慧空间升级的概念。
思必驰是一家做智能语音语言的公司,语音语言是一种人机交互的方式。我们可以把人与人之间的沟通,人与物的沟通扩大到任何的场景。思必驰去年做品牌升级的时候,提出一个概念:沟通万物,打理万事。
人在城市里生活,与城市的所有构成元素交流。智能家居、自动驾驶,包括智慧物流客服方案,其实都是从智慧城市的一个细微景观入手。
在智慧城市的发展下,产品的融合会有一些变化。我们以前跟物流行业合作,物流行业用到AI,可能大家第一反应是客服、呼叫中心线上系统;但是去年,很多大的物流集团,开始做无人车、无人机的配送。到今年,顺丰以及其他的物流和快递的公司,在推出自己的智能硬件耳机,他们用可穿戴的智能硬件产品来做内部控制,降低人力、提高效率。
所以现在已经不能简单地说家居产品只属于智能家居,耳机只属于智能穿戴,客服呼叫中心只属于客服方案,整个行业在AI的发展基础下,整个行业发展融合,带动了整个智慧城市的发展。
智慧城市这个概念非常大,我们现在能感受到的智慧城市的发展主要源于三驾马车:大数据、云计算和互联网。
AI与互联网、大数据、云计算相辅相成,共同发展,带动整个智慧城市下沉到细分行业,包括家居、车载、物流、安防、能源、医疗等各个细分领域的集体发展。
我们分别来看一下,在这几个趋势里面,三驾马车和动力有怎样的变化。
数据
传统讲数据,会把它分为:结构化数据和非结构化数据。结构化数据是计算机能够识别的二进制语言,直白说就是数字。
但是我们会发现,有了网络之后,联网后所有工作、生活、交往沟通中的数据,包括企业服务信息政务系统里,我们所产生的一半以上的数据都叫做非结构化数据。具体的表现包括:语音图像行为动作轨迹轨道等等。
以前AI技术发展没那么好的时候,非结构化的数据很难被运用。有一家AI公司叫地平线,创始人是余凯,记得一篇采访余凯的文章里有一段话:在大概三年前,余凯说看到了百度能够沉淀下来很多数据,但是所有的数据,尤其是非结构化数据,一定要基于场景和行业,他发现这些数据没能得到很好的应用。余凯说他看好在驾驶过程中所产生的这些驾驶的数据,所以他希望全身心地投入到新的落地应用场景里。
这也是为什么最近三四年整个中国的人工智能从技术到产业爆发,全面再发展的一个原因:我们看到了更多数据的可能。
人工智能的技术促进了非结构化数据的应用,而数据反过来能带动人工智能的技术的提升。他们互相促进提升以后,也能反过来,作用于整个社会的信息变革。
云计算
现在与云计算相辅相成、共同发展的是边缘计算。
云计算这两年的焦点在5G上。去年比较火的是运营商开始去部署5G,给人带来的第一个直观感受就是网速快,价格低了。而最高级的感受就是整个城市的效率和数据的稳定,存储、沉淀、清洗、运用都在加速。
当真正实现5G的时候,带给用户最高层次的感觉是万物互联。万物间除了实体的城市外,还有数据构建的虚拟的城市空间,这是云计算发展到最高级的情况。
边缘计算,是这两年非常新的发展。我们在运用云计算和边缘计算同时进行的情况下,整个的运算速度会比单纯的云计算提高60%。在AI里面,边缘计算的外在体现是AI芯片。
这也是为什么这两年很多半导体的公司开始投身做AI芯片,很多算法的公司、AI公司开始做AI芯片。比如寒武纪,做云端的芯片,比如地平线,做针对于自动驾驶车载的芯片,思必驰也在1月初发了芯片。
在最理想的情况下,万物互联数据非常快的时候,也还是需要把一些性能放到本地,放到端侧来进行处理。
举个简单的例子,跟音箱交流的时候说:“我想听周杰伦的歌”,或者:“我想预订车票”,这种完整的交流没问题。而如果只是一个词,比如“关灯”这个动词,这个时候智能音箱可能就需要花时间去理解。
当把AI芯片落地以后,就能够把功耗降到最低,把很多计算能力放到终端里来进行,而这部分能力直接导致未来的社会是中心化还是去中心化的,因为每一个产品都有可能拥有自主计算和决策的能力。
互联网
最后是互联网的爆发。我刚进入这个行业的时候,国内最先爆发的跟AI相关的智能终端是车载,尤其是车载的后装,包括后视镜等等,但让大众的消费者更多地感受到了AI相关的爆发是智能音箱。
去年和前年最火的话题是智能音箱,大家都在问智能音箱是不是人类生活的未来?以后音箱是不是可以控制所有的家具?我当时的回答是:智能音箱不一定会在中国真正爆发,但是音箱的产品已经是未来的趋势。
智能音箱带来的最直接的影响是让全民更加容易地感受到人工智能带来的社会的发展,城市的变迁。从去年开始,整个互联网是从单品的爆发开始,再逐渐蔓延至全行业的爆发。
前天有一个行业的朋友问:现在哪些家居是可以做智能化的?
我回答说这个问题没办法回答,因为全覆盖。拿思必驰现在合作的案例来讲,音箱、电视、空调、电灯、洗碗机、油烟机、马桶等等都可以。不同的行业,所有的产品都在做AI化的升级。或许在未来三年后,语音交互或者人脸识别会成为所有电子产品的标配。
智慧城市的发展、物联网的发展、云计算的发展、大数据发展跟人工智能密不可分,人工智能产业链应该怎么来设置?
我们可以笼统地把它理解为:基础支撑层,比如云计算底层的传感芯片,有大数据是最底层的,大众消费者感知不到的;跟消费者沟通最直接密切相关的是最上面的系统应用层,既包括APP也包括不同的终端的产品;中间的是智能交互层,智能交互层又分为感知认知以及表达智能。
在过去的几年里面,基础支撑层一直在发展,但在过去4、5年里面发展最快的是中间的智能交互层。
在去年到未来,更多的创业机会其实是在系统应用层。在整个智慧城市的发展下,行业在融合边界在消散,跨界在加强,在这里面会有产生很多新的机遇。
去年做音箱很火,中国一下子出现了大大小小几百家智能音箱,今年下半年一定会爆发的是AI耳机,尤其是5G,这不是一个新的话题,但的确是由于AirPods的出现,给了很多中国的创业者新的idea。
在AI方面,国内跟国外最大的区别在于:国外更擅长的从0到1,做开源工具,做底层的基础研发;国内擅长从1到100。
所以现在能看到在未来整个智慧城市的发展路径里,会出现更多的在系统应用层的创新发展,而这一切都是源自于刚刚讲的三驾马车和一个动力。
企业在面对智慧城市的发展理念,我拿思必驰举例告诉大家。
行业融合
AI技术,思必驰是怎么把它运用在行业的融合和长期的探索方向的?过去做的主要是家居、车载、机器人三大方向。
从去年开始,思必驰感受到行业的融合,所以在探索更多的合作案例。比如刚刚提到的顺丰耳机,是跟物流公司在智能电子硬件方面做的新尝试。思必驰跟顺丰这样的物流类龙头企业不仅有硬件的合作,客服层面也在合作;另外思必驰跟某酒店正在合作智能音箱,跟某养老地产正在合作养老型机器人。
思必驰是在依靠原有的自主知识产权的技术能力之上,做了更多的行业探索和发现。
那么我们保持的能力是什么?思必驰是一个技术驱动型的企业,拥有全面目的底层的语音语言感知认知的能力。在过去五六年前谈到语音的时候会谈语音识别率的高低,但识别率只是一个数字。现在有越来越多的客户、开发者、创业者,都认识到语音识别只是一个技术点,识别是语音是一个信号。思必驰真正的在做的,是语音和语言的智能,包括讯飞和百度等语音技术的公司也是这样。
思必驰唯一不同的是会把语音更多地在声学能力上进行处理,把它转化为文本信号或者电脑信号。在未来我们要做好语音和语言的交互,还需要去建立更好的知识空间,类似于知识图谱的能力、对话的能力、沟通交互的能力。
这一套,叫做完整的全面部的语音语言的技术。对思必驰而言,之前主要做的是家居和车载,因为要做细微景观的取舍,所以语音的识别是一个对场景要求特别高的AI技术。
在谈到语音所有性能的时候,如果抛开了场景大前提,一切都毫无意义。语音有极强的不确定性,包括说话人的情况和场景的情况。
对思必驰而言,我们在这之间做了取舍。在2007年成立的时候做的是教育,对外汉语教育和英语口语教育。
在2014年的时候,思必驰把教育事业部剥离了,全面地转向针对互联网,做车里和家里两个场景。在转型以后,教育业务不接了,移动互联网的业务暂停,其他的医疗客服的业务也全都停止,只做车载跟家居。
当把这个行业吃透,把体验打磨到极致以后,最近两年才开始做更多元的行业场景的探索,也就是今天想讲的智慧城市的探索。做智能家居的,涉及到的单品会有音箱、电视、空调、白电等等;在做车载的时候会涉及到更多的内容服务,行车数据等。
慢慢的我们发现,运营商、地产、酒店,这种传统的企业级客户,也需要转型升级AI,需要跟随整个社会的发展,提升他们对人和用户服务的能力。
这就是思必驰现在在做的一件事,基于AI技术赋能更多行业场景语音平台,但是前提建立在已经吃透某个细微的行业分类。
语音平台
为什么大家都觉得现在语音感觉不太智能,或者说好像商业化的落地能力赶不上图像,因为语音很难标准化。
这句话怎么理解?比如说天猫精灵用的全部是思必驰的技术,但是对另外一个客户,也不会完整地把我们跟天猫精灵的合作照搬过去,他需要定制自己的个性化需求,要定制唤醒词,有定制的技能,有非常定制化的需求。
所以在这种环境下,对于语音的AI技术型的企业来讲,做不了标准化。
那我们怎么办?可以做平台,把我们有的AI的能力打包到平台里面,用户给开发者提供他们可以去定制的能力。
以前做细微场景的时候,思必驰做的是定制化的服务,对一个大项目进行定制开发。这两年发现需求越来越多,对一个创业公司来说,最焦灼的是看到业务太多,但是可能没有那么大的能力去全部都接,因为没有办法标准化,所以我们会想做平台。
做平台的第一个目的是把技术底层开放给客户,给开发者提供定制能力。先实现“万物可沟通”,比如音箱跟电视对话,电视里面的整个的对话的定制可以由产品来决定,这是我们通过平台去实现的第一步。
为了用更好的嵌入式开发降低功耗,思必驰在今年年初发布了AI芯片,目前还没有量产,研发AI芯片也是为了赋予智能终端升级的能力。
另外就是“打理万事”。现在所有的数据基本上是非结构化的数据,思必驰有非常庞大的数据处理能力,我们会把这种数据处理和反馈的信息端服务放到全渠道智能服务系统里。
不只是呼叫中心,也不只是智能客服。现在能够打通的是数据挖掘、启发式对话、ASR/TTS/对话定制。
数据挖掘是指对现在的数据做更好的挖掘、清洗、处理。启发式对话是新推出的技术,在政务酒店行业和运营商场景里人机对话的效果非常好。再往后我们会提供更多的技能定制。甚至说在思必驰的全渠道服务里,把智能终端,比如音箱、空调、手机等都理解为用户触点的一个方式。
以上是我们想实现万物可沟通,万事可打理的方式路径。
要做到全渠道智能交互的服务,大前提需要建立在从细微的场景入手,做了足够多足够深的打磨。另外思必驰现在也自有基金,除了主体业务以外,也投了一些跟智慧城市相关的企业。
人工智能的底层是共通的,我们也看到很多机会,比如医疗、幼儿的教学等等,但对思必驰的主体业务来讲,不可能能把所有的行情吃透,所以会选择投资和孵化初创型企业。
最后回到行业融合的内容,给大家举个具体的例子:
思必驰最开始比较擅长的是智能家居、车载和电子,提供包括人机交互解决方案、软硬件一体化的分配方案、麦克风阵列等。
2018年中国智能音箱出货量大概是2500万台,其中有将近2000万台用的是思必驰的语音技术。
之前做音箱的时候,面对的是阿里、腾讯、华为、网易等互联网的公司;从去年开始,我们接到更多跨行业的需求,酒店、运营商、政府、物流、物业等等行业都会有,他们已经把音箱看成了一个企业,可以跟用户主体,跟消费者去进行沟通和交互的终端,成了一种新的跟用户沟通的方式。
所以我们会想把这种能力用到更多的行业里去。在其中思必驰可以提供人机交互解决方案、单点的Turnkey服务,甚至可以提供整机服务,但是即便我们现在能做音箱,能做一个完整的音箱,但是我们仍然坚持to B不to C。
在整个发展的浪潮里,企业仍然需要思考,什么该做什么不该做。在大趋势里,会有很多机会。在沙滩上,大家都在修建城堡的时候,永远要珍惜的是给大家递沙子的机会。
*量子位将陆续整理嘉宾分享实录并发布,点击链接查看更多嘉宾分享:
明略科技集团副总裁唐日新:大城小事|量子位沙龙回顾
量子位AI+系列沙龙是量子位推出的“AI+行业”落地主题活动。每期邀请数家行业领军企业现场分享及讨论,以线下沙龙+线上社群结合的方式开放给行业从业者,进行研讨与交流。
欢迎大家关注量子位AI+沙龙,欢迎感兴趣的小伙伴联系我们,微信:qbitbot7
中关村壹号位于中关村科学城,以“硬科技”(人工智能)为产业主导方向,链接AI领域龙头硬科技企业,并未企业提供全面创新服务,满足企业发展全生命周期,为企业打造全维的产业生态。
— 完 —
活动报名|多模态视频人物识别
加入社群
量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;
欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「好看」吧 !