浅谈百度的开放能力既百度开发者大会感悟
今年七月份正在玩Duer OS的我有幸得到一张百度开发者大会的门票,这让我重新认识了百度,和百度的执行能力。
没记错的话是今年的六月份,陆奇离职百度,这是在外界看来是对百度AI能力的终结。经过这两天的见闻百度仍然是国内最好的AI引擎,开放能力是AT做不到的。
摄于开发者大会的前一天 日落的国家会议中心朝阳区天辰路6号 摘自百度运营小姐姐
百度AI开发者大会主论坛。
最大的亮点就是我能见到李彦宏了,这位知性的理科生也没有辜负广大开发者的期望,把吹的牛都实现了。
1、全球第一款L4级自动驾驶巴士阿波龙量产下线。这是全球首款L4级别的量产车型。总比那个PPT好吧,啧!
下面我们介绍一下百度的Apollo平台
笔者想说一下我对这个平台的见解和看法。我基本上是见证这个技术平台从孕育到强大的。起初2017百度开发者大会Apollo和Duer OS首次出现在公众的视野中,我有幸参加了Apollo的沙龙,那是笔者第一次参加技术沙龙,对此次的沙龙抱着很高愿景,那是Apollo1.0。
笔者当年第一次参加沙龙的时候
Apollo给我的印象是很快上手的集成开发,但是无人驾驶技术的瓶颈太多了,信道的吞吐量,传感器的灵敏度以及应对气候等因素。因为技术太高深了,笔者当时也没听懂。但是,当时让笔者印象最深的事情是:一位年过花甲的老爷爷站起来说:“我的驾校老师在发我驾驶本的第一天就对我说你拿的不是驾驶证是持枪证,而且是杀人不用偿命的持枪证。那么在信息安全问题日益严重的今天无人驾驶汽车的安全性是否是一个难题呢?”顿时笔者感觉这对自动驾驶平台的发展起着至关重要的作用。当然了这个平台只会和厂商合作。详细信息笔者总结了几点给大家一一列举。
①支持强大功能的核心体系:Apollo计划。Apollo托管在Github上的开放代码数量,一年之内就增长了6倍,这次的进步主要体现在软件层面。
②开放能力
Apollo(阿波罗)是一个开放的、完整的、安全的平台,将帮助汽车行业及自动驾驶领域的合作伙伴结合车辆和硬件系统,快速搭建一套属于自己的自动驾驶系统。
③共享资源、加速创新
Apollo开放平台,为你提供技术领先、覆盖广、高自动化的高精地图服务;全球唯一开放,拥有海量数据的仿真引擎;全球开放数据量第一,基于深度学习自动驾驶算法End-to-End。
④持续共赢
Apollo开放平台,你可以更快地研发、测试和部署自动驾驶车辆。参与者越多,积累的行驶数据就越多。与封闭的系统相比,Apollo能以更快的速度成熟,让每个参与者得到更多的受益,同时Apollo平台也将在你的参与之下变得更好!
2、主论坛的硬件主角上场了“昆仑芯片”
①介绍:昆仑是中国在大规模AI运算实践中催生出的芯片,基于百度8年的CPU、GPU和FPGA的AI加速器的研发,20多次的迭代而生,是中国AI芯片的又一里程碑。100+瓦特功耗下提供260Tops性能,可以高效地同时满足训练和推断的需求。
②适用对象:不是面向普通用户的,更适合对AI、深度学习有需求的厂商和机构等。
③适配的需求:深度学习算法等云端需求、自然语言处理、大规模语音识别、自动驾驶、大规模推荐等具体终端场景的计算需求。
④对比:昆仑AI芯片能在100W以上的功耗提供260万亿次/秒的运算速率;英伟达的Xavier自动驾驶处理器的算力大概是30万亿次/秒。
⑤参数:昆仑芯片由三星代工,采用了14nm工艺,内存带宽达到了512GB/s,核心数有数万个。
未来场景:应用到无人驾驶、图像识别等场景。
__________以上关于“昆仑”的参数来自La Luce del Sole
3、百度发布百度大脑3.0
我对这个大概念的理解是百度把自己所有的开放能力进行整合,涵盖业内的几大部分我来列举一下:语音技术、图像技术、人脸与人体识别、视频技术、AR与VR、自然语言处理、数据智能、知识图谱、软硬一体、产品专项解决方案、定制化训练平台、深度学习开放平台。
详情请见:http://ai.baidu.com/
恕我再此不予赘述,他有着一百多项开放能力,在各个领域中都有体现,我就挑大会上展示出的说。
①、百度小程序。
①内容介绍:百度小程序具备更自然、更智能、更开放的三个特点。开发者只需要几行代码就可以直接接入百度大脑3.0的核心AI能力。将彻底打通AI与移动端,让AI在手机上全面落地。
②搭载平台:开发者开发的智能小程序不仅可运行于百度移动端产品,更可以运行于外部APP,以及DuerOS智能家居、Apollo车生活平台上,开发者一次开发就可以实现多端运行。
开源时间:2018年12月
③整体架构介绍
应用案例:爱说唱,玩法:输入歌词,bot以说唱的形式唱出歌曲。
智能小程序在百度的战略地位:用户最常见的需求就是是通过搜索来表达需求,但移动互联网时代,百度是难以满足用户方方面面的需求,所以百度希望让各位开发者一起加入进来,共同服务于用户的各种需求。所以智能小程序的目标是与百度本身的目标高度一致的,那么智能小程序也会和百度一起共同为用户服务。
④能给开发者带来什么?:随着移动互联时代的发展,一些资源商逐渐将流量入口收展,这使得内容服务提供者展示自己的门槛变高。但智能小程序有着天然的流量入口,内容服务商只需要关注用户的需求,把自己的业务逻辑搞清楚即可,而不用考虑流量哪里来,百度为大家提供的就是一个基于搜素场景下的流量大入口。
与其他小程序的不同:(1)更自然,可对接目前已有的其他小程序平台;(2)更智能,为开发者提供AI能力;(3)更开发,与多个合作者合作,重新改变广告模式。
目标及意义:重新定义互联互通,定义一个即可通所有的平台。
在笔者看来这都是BAT这三大神仙的乱斗罢了,谁都想整合资源、整合能力。让软件商们站队。我其实是很不看好的。
❶百度图像识别的代表easyDL。
附上链接地址:http://ai.baidu.com/easydl/
这个平台笔者使用过,不说谎的讲这个我家六岁的弟弟都会用。几百张图片就可以实现图像识别的能力不必用难懂的TF,看了国内圣象地板的案例和键盘厂家,低成本能省去80%的人力,怪不得easy。我列举几个简单点;
·低成本训练模型
训练数据每类仅需20-100张图片。最快10分钟可训练完毕
·丰富应用场景
图片内容检索:定制训练需要识别的各种物体,并结合业务信息展现更丰富识别结果
工业分拣或质检:定制生产线上各种产品识别,进而实现自动分拣或者质检
图片审核:定制图像审核规则,如训练直播场景中抽烟等违规现象
其他:尽情脑洞大开,训练你希望实现的识图模型。
笔者嘱咐一下对GPU的要求高一些,训练模型嘛。我的960M有些吃紧。
4、DuerOS 3.0
接下来笔者介绍笔者感觉最有前瞻性的项目,我与他的渊源可是比Apollo还要亲,亲历他的成长。它的生日与Apollo是同一天的,在2017年的百度开发者大会上发布,就在那个月我申请了DuerOS个人开发板,那时候笔者还是一名高三学生,但是出于兴趣一直在参与DuerOS的开发。
比较一下平台优势现有的平台有科大讯飞、阿里天猫、百度DuerOS、腾讯也有但是并不出现主流趋势,国外的Google Assistant 亚马逊Echo,并且还有其他的小平台就不赘述了
科大讯飞不得不说是国内第一个做这个领域的,语音的识别率能到达业内最高的98%(现在早已被BA超越)它的路子可算是选错了当年一个评估板要3000多,有的小企业都买不起,个人更别说了,并不开放。阿里是这几个主流平台里最封闭的一个,但是阿里的整合能力的确势头很猛,IOT的厂家接入量第一,这对平台来说是极大的优势,在笔者对此领域的观察,DuerOS和阿里天猫的势头比较猛进,更多的开发者愿意选择他们。
笔者参加了N次DuerOS的技术沙龙,见证了1.0到2.0再到这次3.0的发展也拿到了第一批的黑卡会员。
感觉DuerOS的应用十分广泛,每个人可以以不同的方式来利用。地址留给大家:https://dueros.baidu.com/
5、PaddlePaddle深度学习框架 AI之桨
地址:http://www.paddlepaddle.org/
到这里有人就会说了我用TensorFlow不好么?为什么要用这个?反观下这次的“中兴危机”我们为什么会被制裁?到那时候TensorFlow不给我我们用了我们怎么办?
因为笔者也试了试这个国产的深度学习框架感觉很适合国人,社区也逐渐完善,甚至运营小姐姐所说的我也能训练模型,真的是可能的,十分简单。
附上使用文档地址:
http://www.paddlepaddle.org/docs/0.14.0/documentation/fluid/zh/new_docs/beginners_guide/index.ht