人工智能发展的三要素:数据、运算能力、算法;
人工智能将影响所有产业:
1.服务机器人(扫地机器人、陪伴机器人、导购机器人、家庭助理)和人机交互;
2.工业机器人和智能工厂;
3.自动驾驶(Google测试200万英里,相当于300年驾龄;特斯拉已经开始在司机介入下大范围使用;百度3年内可以商业化)与智能交通;
4.智能医疗和健康;IBM的癌症诊断辅助获得FDA批准,Google&Stanford的皮肤癌诊断达专家水平。
5.智能金融:Kensho,替代分析师的利器;芝麻信用,征信分析。
人工智能的发展与未来:
今天:全球前五大市值公司都是互联网公司;
20年后:全球前五大市值公司都是人工智能公司;
麦肯锡报告–AI在未来20年替代50%工作;
强人工智能不会很快实现,特定场景、特定需求的弱人工智能会成为主流。
摩尔定律指每十八至二十四个月,计算机的成本会下降一半,性能则会提升一倍,使计算和应用不断发展。整个摩尔定律已经在按另外一个轨道在发展,已经不是每个单位面积上晶体管的数目,而是架构的改进,使得计算由逻辑运算向人工智能运算演进。那么就是这样的问题:人工智能运算是提升 CPU 工艺向前发展,还是设计一个新架构。
我们可以看到从 PC 互联网到移动互联网到 internet of smart things,实际上对 AI 的要求越来越高。对 PC 互联网来说,对 AI 的要求其实没有那么高,但在移动互联网上,这种要求出现了。
边缘计算要求是实时、低功耗、低成本的,并且是隐私受保护的。比如这在汽车上面,就是一个很大的一个应用场景——不可能前面有小孩子突然横穿马路,你还要把数据传上数据中心,处理完了以后再传回来,这是不可想象的。所以一定要本地计算,要实时处理没有延迟。
很多移动设备,比如 Amazon 的 Echo,就是把很多计算往边缘设备上去推。又比如监控摄像头,中国去年一共部署了一亿个。监控摄像头的资料,其实存3个月就扔掉了。未来,对于所有这些摄像头,都会有专门的处理器,去处理实时的视频,这是一个大的趋势。
未来的5到10年,最具颠覆性的产业机会是什么?通常来讲,产业机会分成两个阶段,首先是一波2B的机会。2B的机会,就是 Enabling Technology,公司就是做 technology 本身的。它是提供枪炮弹药的,给谁提供呢?给第二波的机会提供。第二波的机会是什么呢?就是 Technology-enabled Business。当然这些都是2C的。2B就是给 Enterprise 提供服务。这些 Enterprise 再去捕捉 consumer-orient 的机会。这个 pattern确实在历史上反复发生。
举一个例子,当年 PC 互联网刚出现的时候,时间是在90年代末,那时没有一家互联网公司是挣钱的,大家都看到了这里面存在机会,但在这个阶段,首先要做的工作是把架构、网络给做起来吧? 所以 CISCO 这样的公司会表现得更好。另外也会有一些2B的培训师等等,这个阶段整体上属于为B端造枪造炮提供弹药的阶段,这算是一种曲线救国吧。
然后才有2C的大的互联网公司的出现,比如 Google。再比如移动互联网,首先要有 CDMA 这样的软件算法,放在芯片里面,使每个移动设备 stay connected。然后才是 Apple 这样的公司的崛起。中国的大部分投资者、创业者和企业家,他们看重的就是这样一波机会。
在我们进入这个市场的时候,美国人把这些基础技术已经做完了,从2000年开始到今天,我们是在享受上个世纪八九十年代科技成长的所带来的的一个环境,然后我们去做了这些用户导向的企业。
但今天我们去看这个整个这个创业环境,2C的这种创新其实代价已经非常的高昂,比如嘀嘀融了上百亿美元,美团也有几十亿美元,这个投资其实越来越沉重。其实你想想看,当时 Google 只融了两千万美元就上市了,百度差不多也就是千万美元,腾讯也是如此。在那个时候其实有大把的机会去捕捉。但是现在的话呢?八九十年代技术创新所带来的这些能力其实已经被发掘的差不多了,所以我们会发现创新越来越沉重。
每年因为交通事故死亡140万人,百公里的油耗产生废气,排放雾霾等一系列的问题。
停车难:第一,一辆车96%的时间是停着的,他而且需要两个停车位;第二,在城市的商业中心CBD附近,35%的航行里程是与找停车位相关;第三,大城市15%以上的土地是用来停车的。
无论是摇号、限行、交通拥堵费,还是网约车,都没办法根本性上解决这些问题。
我们来看今天为什么有那么多问题——本质上因为车太多。例如北京,有接近六百万私家车,而提供按需出行服务的出租车只有7万辆左右。对于我们绝大多数人来说,首先打车很难,其次打车很贵。但是我们相信有了智能驾驶之后,在10年之后,城市里面车辆的总保有量可以减少一半,只有100万辆私家车,还有200万辆是出租车。而这些出租车是无人驾驶出租车。那么根据大数据的运算规律,我们可以根据全城人群的分布和出行的规律,把这200万辆车分布在城市的各个角落。保证每个人一叫车,两分钟之内就来车。而且,我们打车的费用可以降到今天的1/3。
如今“滴滴出行”一天的峰值能够达到2100万单;这什么概念呢?阿里巴巴全品类的电商相加一天大约是3000-5000万单。美团、大众点评吃喝玩乐住加起来一天大约1300万单。因此,出行是相当刚性的、高频的需求。
一旦有无人驾驶,一天达到5亿单是完全没有问题的,这将成为电商所有品类当中最大的交易量。而且,未来的车可能长得不太像车,其交通工具的属性会降低,商业空间的属性会增加。大家再一次脑补,在里面放一台咖啡机,它就是移动星巴克;放一块大屏幕,它就是移动万达影城;放块小屏幕,它可以是移动的分众传媒;在里面放一套办公设备,它就移动的写字楼。未来你打车,可能就十来块钱,但喝杯咖啡需要二三十块钱,看场电影需要三四十块钱。因此,整套新的商业体系就会呈现出来,因此也给我们带来一个巨大的机会。
智能驾驶里面有一些什么样的AI技术?我认为,有三样非常重要,我把它分成3种司机:第一种,叫新司机。想象一下,刚刚从驾校里面考到了驾照,你懂得交通规则,能够保证不去撞车和撞人;第二阶段,你开着开着,变成了一个认路的司机,在任何情况下都不会迷路;第三个阶段,就变成老司机。老司机体现在3个方面:一、开车开得非常好;二、你不肉,这个很有竞争性;三、碰到一些新的情况,你也不慌。
其实,智能驾驶要达到这3个方面:一是感知和认知的理解部分;二是地图和定位;三是认知的决策部分。先看感知和认知的理解,传统上无人驾驶,他是从“激光雷达”开始。无论是树,草坪,车辆,房子等等,激光雷达都能够很准确地把模型建立出来。谷歌第一代、第二代、第三代无人驾驶车,上面有个激光雷达。百度的第一代、第二代车的顶上有激光雷达。两边和后面有3个小的激光雷达。顶上的激光雷达,在国内市价是70万人民币;3个小的激光雷达,每个大约是七八万人民币。这是钱堆出来的。我们做了一个低速车,上面其实也有一个激光雷达,就是七八万人民币。那么显然,这东西很贵,自然而然会让大家去想我有没有其他的解决方案——就是基于视觉以及毫米波雷达,超声波等等这些辅助传感器啊。但是,最重要的还是视觉,视觉构建的不是一个几何世界,是一个像素世界。基于一个像素世界,要去理解和预测,这是基于视觉的智能驾驶。
那么,我们拿在这一块商业化最为成功的特斯拉为例。这辆特斯拉Model S上面就有一个单目摄像头,作为它的主要的传感器;下面保险杠前面正中,有一个毫米波雷达;车周周边一圈有12个超声波传感器。大家可以看到这些小圆口都是超声波传感器。它通过这3种传感器,能够很好地达到新司机的要求,去理解规则,去感知这个世界。
SLAM技术的鲁棒性:SLAM技术由于视觉质量技术,非常受限于在环境当中能够发现的这些特征点,比如说四处都是白墙时是很难获取特征点的。
多传感器融合:摄像头、毫米波雷达、超声波传感器联合使用的算法融合。
基于基础高精地图的地图学习和更新:不但具备定位的功能,也能够帮助地图进行更新,那用户始终会拿到最新的地图。
无限提升准确率:1000-10000倍的标注数据(大规模众包数据收集+基于机器学习的半自动标注)。
“老司机”的要求:第一步是开得很稳,很舒适;第二步是开的不肉,具有社会性和竞争性;第三步是怎么去处理未知的情况,能够开得万无一失,一辆奔驰S级轿车,上面的代码量是波音787梦想客机代码量的16倍。大家可以想见,要对一辆车进行很好的测试,要求非常高。但事实上,比代码更难的是数据和上面的随机算法机器学习。
1.汽车工程学会的定义将自动驾驶分为0到5级:0级就是全人驾驶;1级还是人驾驶,但是系统、机器有时会介入,比如说它看见你离前车太近,它会滴滴滴警告一下,甚至再近了,它给你踩一把刹车;2级就是在相当长的一段时间里面自己去驾驶,比如说像特斯拉Autopilot,在封闭的结构化的高速公路上,驾驶员还需要把注意力放在路上,但是其实这过程中,车是自己在开。它自己能够识别车道线,始终保持在车道的中间,甚至它还具备一定的全自动泊车功能;3级跟2级典型的差别,首先驾驶员不用全神贯注在路上,他可以做其他的事情,这个系统可以给予驾驶员八秒到十秒时间重新回到决策环中,这是一个非常明显的要求,另外的话它会在自动型上面给予更多的一些好处,比如说不一定完全是在高速公路上,在一些更复杂的条件下也可以;4级几乎就是无人驾驶,或者在某些情况下需要人干预,或者只能在一个特定的环境下做无人驾驶。比如有的场景特别简单,就不需要干预;5级就是全天候、全区域、全速度的无人驾驶。
2.从国际主流车厂和科技公司的路线图来说的话,到2021年会有4级的车上路。
3.未来10年以内,出现人车分流,也就是人开的车和自动驾驶的汽车分开车道行驶。一统计数据:当自动驾驶在城市里面超过交通运量25%以后,就值得为它单开车道。
4.5G有两个任务:第一实现关键任务下的通讯,延迟做到个位数毫秒级别,关键任务就包括无人驾驶和远程手术等等。第二带宽变得很大,可以将一部分工作拿到云上去。
5.汽车这个领域是值得专门去定制芯片的,且芯片应该是可编程的。
6.传统汽车厂商和互联网为代表的公司博弈:第一是汽车厂必须跟出行业务结合起来;第二是汽车厂不再满足于只做一个集成商,他现在希望能够更多地去拥有技术。第三是科技公司需要传统车厂的硬件合作。
金融生活服务的各种各样的场景:医疗,缴费,教育,乘坐高铁、地铁、汽车,交罚款,查税等。在美国信用等于财富,在国内如何产生信用分?这是个技术活,我们需要从数据,从各个角度、维度来判断一个人的信用。当然不光是人,还有小微企业。希望运用大数据的技术,通过智能的技术把它自动化,降低成本。比如智能助理、营销、保险。
1.智能助理:需要非常好的落脚点。比如智能客服有海量的电话要接,海量的问题要回答。还有基金销售,理财顾问,保险顾问,审核等,在这一系列的环境中,智能助理是一个非常落地的场景。
2.营销:营销从任何商业角度来讲都是非常重要的。比如需要做一个营销策略,可通过大数据、云计算使成本急速降低,保证风控的质量,才能大规模,低成本。
3.保险:保险本身是一个数据驱动的应用,从营销到保险的个性化定价,到新的基于互联网的场景,新保险类别的开发等等,其实都离不开数据。
今年我们的目标已经不是自助率,而是问题解决率。到今年夏天,我们的智能客服的问题解决率从百分五十几,到现在快70%,而人工的用户问题解决率是71%到72%左右,我们的目标就是要超过人工。超过这个意味着什么?其实我不光能够自助,我回答问题比人还准。那其实这个代表什么?不到一年,我们为公司省一亿,除去人的成本和GPU的成本。我们客服部门去年其实裁了100人。减少的100人去做递推,做口碑业务,这部分大量的人力就省下来了,这就是AI真实的案例。
异常检测:出现问题是即时定位并解决。核心思想有几部分:一部分就是实时计算,要把数据实时性提高,做到秒级定位。原来一个流程发现一个问题,到电商的商务异常处理,需要两小时。从发现问题13分钟,到响应介入50分钟,到异常环节75分钟,到最后环节要两个多小时,125分钟,这是以前的过程。现在的话,我们秒级解决问题,就是零分钟预知,解决问题不到半个小时。这样的一个例子其实省下了快1000通电话,而这个例子有很多,就省下无数的电话。
跟传统只做推荐不太一样,阿里是一个生态系,那生态系里面其实各个数据都会进来。我不是说因为你看过的文章,又推一篇文章,这是头条的经典模式。那有各种各样的,比如电商的购买行为能否助力财富和保险,我们叫迁移学习,或者叫信息整合。
蚂蚁DNA:就是一个编码技术,把这个用户实体包括产品,文本和外面的article,我们做一个统一空间里embedding,转来转去有很多点。然后,把这个人在这个点里边直接表达出来。它的好处,比如说加密,如果你只看着点,你是不知道什么意思,但是很多合作方,比如说,我们保险公司合作,把这个用户的数据加密,非常关键的一个问题。
从眼纹到人脸到声纹等整个结合,用来证明“你就是你”这样的问题。这个其实有非常大的价值。比如健康险,我们通过新的数据源融合进来能够反欺诈,更好地理解健康的风险;比如说场景险,就是完全互联网化的一个场景险:穿紧身裤的很多人,在淘宝天猫上购买手机新屏幕服务,干脆直接给你做个保险,这个保险呢,就是碎屏险。
基于大数据和机器学习的信贷模式是蚂蚁微贷的优势,在这个模式下,客户立即申请立即获贷,不良率低,可以解决小微企业和个人贷款难的问题:金额高、流程长、授信难。