以桨为楫 修己度人(四)

目录
1.人工智能开创的新时代
2.使命开启飞桨一春独占
3.技术突破奠定飞桨品牌一骑绝尘
4.行业应用积淀飞桨品牌一枝独秀
5.生态传播造就飞桨品牌一众独妍
6.深度学习平台的现状和未来思考

深度学习平台的现状和未来思考
作为我国首个功能丰富、开源开放的深度学习中文平台,百度飞桨充分凸显了技术自研,创新突破的特性,不但在底层框架彻底实现了技术的全面独立自主,也以持续开源核心能力,为产业、学术、科研创新提供基础底座和落地实践,其标杆意义和示范参考具有全球价值。飞桨以领先者的身份,引领着国内科技行业头部品牌一起参与产业级深度学习平台如旷视天元(MegEngine)、华为MindSpore、计图(Jittor)等共同进步,以及小米MACE、阿里MNN、腾讯NCNN、OPEN AI LAB(开放智能)Tengine等一批推理引擎工具开源,推动开源算法框架加快创新发展。同时,在语音、视觉等基础技术、开放计算及垂直领域的AI开放平台建设不断推进和飞速发展,逐步壮大国内开源开放平台生态体系。
据不完全统计,目前国内开源开放平台超过40个,且服务能力进一步增强,已具备了加速国内人工智能产业创新发展的能力。基础技术服务平台方面,如阿里、滴滴、腾讯、网易、京东等已建立运营的综合性AI能力开放平台。云从、旷视、美图、萤石、虹软等视觉图像识别AI能力开放平台,科大讯飞、依图、小米小爱、搜狗、学而思、有道等语音识别AI能力开放平台。开放计算服务平台方面,如阿里云、华为云、百度云、京东云、金山云、腾讯云等已建立运营的AI云计算服务开放能力平台。垂直领域开源开放平台方面,有百度Apollo自动驾驶开放平台、阿里城市大脑开放平台、腾讯智能医疗开放平台等。其中如百度Apollo平台已经汇聚了全球210家生态合作伙伴,全球有135个国家超过80000名开发者使用Apollo开源代码,开源代码数量超过70万,Apollo自动驾驶平台已成为全球最强大、最开放、最活跃的自动驾驶平台。
AI 应用开放平台加速产业生态建设,如已组织筹建国内首家开源基金会-开放原子开源基金会,华为OpenHarmony、腾讯Tiny OS、阿里巴巴Ali OS等10个项目已捐赠给基金会进行孵化,变“一家所有”为“开源共有”,吸引产业链上下游共建生态。新一代人工智能产业技术创新战略联盟组织产学研各方力量合作构建“Openl 启智开放平台”,汇集开源软件、开源硬件和开放数据,旨在促进AI领域的开源开放协同创新,打通AI技术链、创新链、生态链等产业链各环节资源,推动AI在社会经济各领域广泛应用,加速产业生态建设。
多模态大模型探索活跃,预训练模型类比于算法层的基础设施,通过构建能够同时解决语音、视觉、自然语言处理等领域多种问题的通用模型装置,使得千行百业使用AI算法时,可直接调用通用模型接口,使用少量数据进行微调,即可解决特定领域的应用任务,是AI算法实现规模化应用复制的基础装置。2020年以来,谷歌、微软、英伟达、智源人工智能研究院、阿里、华为、百度、浪潮等国内外科技巨头纷纷展开大规模研究和探索。当前,超大规模预训练模型在内容创意生成、语言和风格转换、对话等领域的落地进展较快。随着未来模型性能的不断提升及其平台的不断完善,大模型或将成为下一代AI基础平台,并赋能各行各业。目前国内超大规模预训练模型进展迅速,一是头部企业自研大模型体量达千亿级参数规模。如华为于2021年4月发布的盘古系列超大规模预训练模型,包括30亿参数的全球最大视觉(CV)预训练模型,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB 训练数据的全球最大中文语言(NLP)预训练模型,开启工业化AI开发新模式。北京智源人工智能研究院发布的超大规模智能模型“悟道2.0”,模型参数达到1.75万亿,超过谷歌 Switch Transformer 模型成为全球最大的预训练模型。浪潮于2021年9月发布全球最大规模AI巨量模型“源1.0”大模型,阿里M6大模型以10万级参数量成为当前全球最大AI预训练模型。二是效率不断提升,商业化场景日益丰富。过去10年中,用于AI训练模型的计算资源激增,AI训练的计算复杂度每年增长10倍。阿里M6大模型与OpenAI的GPT-3在同等参数规模下相比,其能耗仅为GPT-3的1%,且效率提升近11倍。作为国内首个商业化落地的多模态大模型,M6已在超40个场景中应用,日调用量上亿。
阿里云AI开放服务,依托达摩院技术创新,视觉AI能力领衔发展。阿里AI(阿里灵杰)依托阿里云基础设施、大数据和AI工程能力、场景算法技术等,为企业和开发者提供云原生的AI能力体系。阿里云是阿里提供AI开放服务的阵地,当前阿里云提供的AI开放服务包含十多个细分方向、百余种场景的视觉AI能力(阿里云视觉智能开放平台),以及语音识别、语音合成、语音分析、机器翻译、智能增长引擎等AI能力。依托达摩院底层技术创新、阿里云商业化及生态能力,阿里云视觉智能开放平台面向视觉智能技术企业和开发商(含开发者),为其提供易用、普惠的视觉API服务,已提供超过200项视觉能力。以阿里云ET城市大脑为例,其面向与城市治理有关的全部生态参与者开放平台AI能力,服务医疗、城管、环境、旅游、城规、平安、民生等领域,为城市提供全面的人工智能中枢。ET城市大脑开放的AI能力来自阿里云智能一体化计算平台、数据资源平台、智能平台和应用支撑平台四大设施,广泛连接政府、科研机构、创业者等生态伙伴。
腾讯AI开放平台,整合内部优势AI资源,不断构筑全维度领先优势。腾讯以腾讯云和AI开放平台为核心,开放腾讯全栈的AI产品能力。腾讯云为腾讯AI能力的商业化出口,主力推动AI技术与各行业的结合,持续释放AI应用价值。腾讯AI开放平台汇聚技术、专业人才和行业资源,通过不断整合内部优势AI资源,依托腾讯AI Lab、腾讯云、优图实验室及合作伙伴的AI技术能力,不断构筑全维度领先优势,打造产业智能化新引擎。目前腾讯云从多个层面完成AI新基建的整体布局,基于内部业务(游戏、社交)受众的需求,及内部研究课题孵化的落地项目,加之内部战略研究调研出的一些需求和痛点(医疗)。腾讯AI技术实力主要沉淀在计算机视觉、语音识别、自然语言处理、机器学习四大板块,除了和主营业务联动较多的社交和游戏之外,AI+医疗、AI+制药也是近两年的主攻方向。
科大讯飞开放平台,面向产业数字化深度挖掘行业应用价值。2021年10月25日,在科大讯飞全球1024开发者节开幕式上,讯飞开放平台2.0正式发布,从单纯将各项单项AI能力提供给合作伙伴,进阶为面向产业数字化深度挖掘行业的应用价值。讯飞开放平台2.0联合行业龙头共同搭建基线底座,通过行业低代码与零代码面向开发者开放应用场景、征集应用创意,以标准体系、测试平台、认证体系、培训平台、低代码开发平台、开发者大赛六大举措支撑开放平台2.0战略落地。未来,讯飞开放平台将开放多项技术,包括覆盖全球、灵活定制的多语种,通过产教融合,培养更多的人工智能人才,释放更多优质资源赋能优秀创业者。同时,制定行业标准,推动产业健康发展,携手生态伙伴打造更多行业标杆解决方案,创造更多有价值的行业场景。
据预测,受政策红利与下游应用领域需求驱动,深度学习开放平台市场稳步增长。在目前国内市场规模已达百亿元的基础上,黄金十年,年复合增长率有望实现60%。秉持开源精神、建设开放生态、打造开放平台,大大降低企业应用成本,提高企业使用意愿,持续推动AI市场繁荣发展。深度学习开放平台将行业专家、各行业专业人员、开发者和科学家聚集在一起的力量和潜力无限。面临如此快速变化的社会,共同努力、共享信息的紧迫性和重要价值显而易见。
由国家科技部牵头建设的新一代人工智能开放创新平台,科技行业头部品牌成为其建设的主力。科技部指出开放创新平台的建设理念是:聚焦人工智能重点细分领域,充分发挥行业领军企业、研究机构的引领示范作用,有效整合技术资源、产业链资源和金融资源,成为持续输出人工智能核心研发能力和服务能力的重要创新载体。其实质内涵是,以深度学习开放平台为基座打造生态链,构建向产业链上下游延伸的全栈能力,赋能传统企业的智能化变革。传统企业在科技企业打造垂直行业应用的智能生态的影响带动下,依托本身庞大的产品体系及市场占有率,积极推进自身智能化转型战略,可见,“开放、共享”已成为推动AI技术创新和产业发展的重要理念。对于国内企业而言,通过头部品牌建设深度学习平台和生态,进而带动中小型相关企业和技术队伍共同发展,能够有效强化AI技术及产业对科技、经济、社会发展和国家安全的全面支撑。
从全球范围来看,深度学习开放平台如何发挥基础设施的最大优势,为生态伙伴提供价值和支持,成为决定其竞争力强弱的关键。AI正内化为数字底座,逐渐成数字时代的基础能力。2001年《麻省理工科技评论》首次推出“十大突破性技术”时,自然语言处理便榜上有名。之后的二十年,深度学习、强化学习、对抗神经网络、GPT-3(自然语言处理领域新的技术突破)等机器学习方式和学习模型上的技术突破,不断让机器智能向“人的智能”靠近,一步步将AI技术在多商业场景的落地推向应用高潮。从智能手表、语音助手、AR、VR等硬件到支付、自动驾驶、医药等行业级应用,已成为数字经济时代下智能产品的基础能力和智能底座。
AI在过去十年中达到当前的发展高度,深度学习无疑是最大的技术功臣。深度学习的核心技术灵感来源于大脑的神经元和突触,从大规模数据量中学习、做出预测,让机器变得更聪明。智能语音、自然语言处理、计算机视觉与强化学习是AI前十年的技术主线并取得了显著成果。单就自然语言处理方面,深度学习的发展促使认知层的自然语言处理技术取得重大突破,已被广泛应用于词性标注、语法分析、情感分析、信息检索、自动问答、机器翻译和关系分类等自然语言处理的关键任务中。
人工智能包括三个层次,即计算智能、感知智能、认知智能。在算力和储存手段不断升级驱动下,计算智能已经实现。在移动互联网、大数据、云计算等技术发展驱动下,非结构化数据的价值被重视和挖掘,语音、图像、视频、触点等感知智能在快速发展。在计算智能和感知智能发展基础上,AI正在向能够分析、思考、理解、判断等认知智能延伸。在技术演进的临界点,深度学习的红利有待深入挖掘,带动AI实现感知向认知迈进的过程中,深度学习将持续推动自然语言处理等认知层核心技术的突破发展。并在基础理论研究,从粒子物理学、结构生物学再到宇宙学,深度学习能够在大型数据集中学习特征,对不同的对象进行分类,发现科学规律,创新基础科学理论过程中大放异彩。如萨塞克斯大学和伦敦大学学院采用深度学习技术,通过图神经网络学习30年轨迹数据来模拟太阳系的太阳、行星和大型卫星的动力学,发现模型的力学定律解析表达式等效于牛顿万有引力定律并预估天体质量。
黄金十年,随着更高维、更自治、多模态、大模型等底层技术的螺旋式创新和行业应用的深化渗透,量子计算、无监督学习、浅层学习网络与算力进展将成为重心,计算机视觉、自然语言理解与交流、认知与推理、博弈与伦理等技术,相互渗透融合的发展趋势更加明显。自监督学习是无监督学习的核心突破方向,目前自监督训练大模型的发展有助于AI的系统性发展。同时,算力层未来的发展也将呈现三个特点,一是多种架构百花齐放的状态,二是中心化的算力与边缘终端算力快速发展,三是专用算力日渐成势。技术突破,会让AI逐渐拥有人类大脑认知般的灵活性和自主意识。算法方面,近期新算法聚焦提升数据的质量与模型参数规模,深挖现有技术路径发展潜力,通过大规模预训练模型、自主生成数据、依托知识图谱常识关系、利用多源数据等方式弥补深度学习在通用泛化性、小数据、可解释性、自主学习能力等方面局限性,不断提升解决问题的水平和深度,引领产业创新发展和结构升级。如谷歌提出基于预训练模型微调的方法ModelSoup,将ImageNet准确度刷新到90.94%的新高度。
深度学习开放平台建设必须久久为功,才可成就未来繁荣之基石。未来十年,中国有望成为全球最大的人工智能市场,占全球四分之一的市场份额。因而深度学习开放平台和生态是弯道超车、占据全球技术领先优势地位的必由之路。深度学习开放平台为产业各层次各环节协同共赢提供通用基础设施,是重新定义中国创造的重中之重。
展望黄金十年,深度学习平台将围绕技术实力、功能体验、生态模式三个维度演进迭代。从技术实力上看,深度学习平台将在深度挖掘、优化成熟技术的基础上,更好融合自监督学习、强化学习、迁移学习、小数据等前沿技术,通过打造简易高效的创新工具帮助不断拓展应用视野和能力边界,推动生产生活全维度创新进步。从功能体验上看,我国企业和产业有自身的特点,对AI功能需求也有其独特性,未来深度学习平台将充分重视我国企业个性化需求并解构业务形态,结合细分场景特点进一步优化平台功能细节,实现与不同行业、企业和业务环节的灵活适配,不断提升面向辅助决策、预测、推理等环节的技术能力,帮助企业在智能时代确立领先优势。从生态模式来看,生态的迭代开放将是深度学习平台体系的重要标志。伴随着消费者主权的崛起,深度学习平台系统功能架构将变得越来越丰富复杂,这种复杂来自于客户的个性化、场景的多样性以及技术本身的复杂性等方面,平台的建设主体从平台拥有者向“平台拥有者+行业客户”联合开发演进,平台内容从有限、封闭、定制化的功能模块向海量、开放、通用性的技术工具转变,从而在平台与用户之间构建相互促进、双向迭代的生态体系。
以深度学习平台为牵引的全行业智能化转型拉开帷幕,帮助企业乃至国家在数字经济与智能经济时代获得发展先机。面对突如其来的疫情冲击,深度学习平台广泛应用,有力阻击疫情蔓延、加速药物研发、推动企业转型、助力复工复产,社会价值初显。从更长周期和更广视野来看,深度学习平台将持续提升传统行业高附加值产品的比重,进一步优化产业结构,增强国家产业经济韧性和抗风险能力,已成为一项具有战略性、全局性、时代性、现实性的紧迫任务。需要政府、科研机构、人工智能企业和传统行业企业等各方通力协作配合,共同营造积极健康的产业生态。
实际上,深度学习平台的竞争,表明看是技术之争,其实更是人工智能行业入口、标准、规则、话语权的竞争。以飞桨为代表的国内深度学习开源平台,肩负重任,勇猛精进,以桨为楫,授人以渔,服务千万用户,赋能千行百业。正如《浪潮之巅》提到 , 中国算力产业应该做的三件事 : 一是建设基础设施规模 , 二是提升算力效率 , 三是在基础设施上提供足够的开发能力。" 要把这些事做完 , 算力才真正能够惠及到企业 , 惠及到个人。而修己度人,一路飞奔的飞桨,正是具备这普世情怀的无上智者和践行者。

你可能感兴趣的:(人工智能,深度学习,AIGC,大模型,多模态)