3月7日,由OpenI & InfoQ联合推出的首档直播栏目《人工智能开源录 | 对话OpenI启智社区》在InfoQ视频号正式开播啦~
首期邀请到的嘉宾是来自鹏城实验室OpenI启智社区运营中心主任、国防科大副教授、CCF开源发展委员会常务委员余跃老师,通过InfoQ的主持人任传英围绕“AI开源创新的发展与探索”的主题对嘉宾进行访谈对话的形式进行。
人工智能开源录 | 对话OpenI启智社区:智能无处不在,AI开源创新的发展与探索
整场直播收视乐观,主持人就OpenI启智社区及推荐的开源项目、活跃的开源社区、如何提供算力资源、社区对开发者的规划等与OpenI启智社区相关的问题,及人工智能领域相关的话题,如开源的最大意义、我国开源现状与瓶颈、未来人工智能发展趋势等问题与余跃老师进行了探讨,余跃老师进行了深入的剖析与解答。
直播间的互动也很频繁,观众朋友们基于余老师的分享,就人工智能开源、东数西算背景下的规划及对大数据的影响、大模型带来的变革等话题在直播间进行提问,余跃老师也进行了相应的精彩回答。
01
对话OpenI启智社区的开源及未来
在主持人问到余老师和OpenI启智社区之间的关系时,余老师首先介绍OpenI启智社区是在国家在实施新一代人工智能发展战略,以及在十四五期间,开源成为了国家战略这样的一个背景下,由科技部新一代人工智能产业技术创新联盟,简称叫AITISA,联合鹏城实验室、国防科技大学、北京大学以及北航、华为、百度等一系列的国内人工智能领域比较有影响力的产学研单位发起的一个开源的公益的组织。希望通过开源的力量去推进我们国家的人工智能技术的发展和汇聚我们国家做开源的这些开发者和各个单位的力量。
同时,余老师也介绍了他本人的工作除了做研究之外,另外一个就是组织OpenI启智社区这个基础平台如何能更好的去服务更多的开发者,将算力、数据模型等这些技术统一起来,以及如何更好的做好社区运营。
针对主持人提出的人工智能等创新带来的技术新需求这个话题,余老师提出人工智能现在的发展还是非常快,但真正做应用的话,面临的挑战也不少,并从软件和智能这两方面的视角来进行了深入的阐述。
对于OpenI启智社区可以给开发者、企业提供哪些算力资源这个问题,余老师指出在启智平台的技术体系上,从底层提供一定的公益性的开放管理,通过算力的支持促进国家开源生态的建设。同时,在教育环节,为学生在上课的过程中通过提供算力为他们打造一定的实验环境,希望通过打造一站式的开发环境给更多的开发者提供帮助。
对于OpenI启智社区能给开发者和团队带来哪些可以应用的资源这个问题,余老师从基础设施、运营资源、实验环境、技术伙伴及家国情怀等方面进行了解答。
对于OpenI启智社区有哪些值得推荐的开源项目,余老师指出,社区目前已有七千多个各种各样的仓库,有很多来自高校的老师或者是学生做的实验类型的算法或者模型。
比较有意思的开源项目,余老师也推荐了启智自己推出的开源项目aiforge,整个a i 协作平台开发环境是开源的,平台所有的开发活动、里程碑、代码评论测试等都在上面。另外,与华为一起做的盘古α 大模型,是业界首个2000亿参数中文自回归语言模型。以及一些来自企业的,比如说像TCL研究院将深度学习跟视觉、工业质检结合起来的一些项目。
基于目前比较火的一个话题“东数西算“,主持人提问在此大背景下,OpenI启智社区会有哪些相关的规划。余老师从工程计算领域出发,希望能有一个软件体系或者是技术体系,能将各个分布式的算力中心可以广域互联起来,然后在上面做相关的任务调度,使得整体的计算性能更高。
02
对话人工智能的发展与趋势
了解完OpenI启智社区后,主持人从本期主题出发,与余老师畅聊人工智能开源它最大的意义。余老师指出,开源的意义本身有很多。从技术层面来讲,技术本身开源带来的整体安全性会更好。从生态方面,通过开源来建设生态,这是一个很普遍的做法。
聊到我国的人工智能开源发展现状时,余老师首先指出我国的根技术相比别人来讲还是比较薄弱,也缺乏能更多的产生普遍性意义的原创算法。同时,余老师也借用《人件》这本书里面讲的,“去思考技术本身比做技术本身更重要“,需要大家去思考一些真正值得做,或者是愿意去投入的事情。
对于人工智能开源会有什么样的发展趋势这个话题,余老师认为未来人工智能的技术发展,也可能在看之前的技术。未来这个人工智能技术变成通用技术之后,它需要去一些专业化的色彩从而变成更普遍应用的一些特点,未来的人工智能也会作为一些基础设施的技术。
基于大模型,余老师也补充了在算力和数据集方面的思考。从算力层面,做大模型需要很高的算力成本,不是所有人都有机会和有能力去做大模型,需要软件技术跟a i 技术相结合发展。同时,如何让数据能快速加载到算力当中发挥作用,怎么做好算力与数据的平衡,其实是一个挺值得研究的课题。
聊到人工智能大模型时代的到来会带来哪一些变革时,余老师认为人工智能大模型可能一个是对于过去的技术的一个升级。首先,大模型对云技术其实提出了更多新的挑战,其次是大模型本身,如果它成为基础设施,通过接口等方式去服务更多的人,这对于模型和相关的软件技术、配套技术会带来的一些挑战和新的变革。
03
与网友交流互动
整场直播中,主持人也挑选了观众的相应话题与余老师进行探讨。
有对开源感兴趣的观众,让余老师分享一些活跃的开源社区。余老师针对人工智能的开源社区推荐了linux foundation旗下积累了一些技术体系的的AI&Data子社区,以及云原生的c n c f基金会。另外还有一些垂直社区,比如paddle飞桨技术框架有一个独立的飞桨社区,以及华为MindSpore、昇腾等社区。
有对东数西算的话题感兴趣的观众,在直播间提问政策会对大数据分析、数据处理产生怎样的影响。余老师谈到国家规划的枢纽节点都是在一些可能可以被这个战略所带动的一些城市,在这些节点上去做大数据分析,和在原本已经汇聚了很大数据的节点去做分析,可能得出来的视角会有很大的差异,可能会带来一些层次化的改造或者变化。
对模型感兴趣的观众提问,大模型小模型哪个更适合产业当下发展的需求。余老师对此解答道,当下是小模型更适合去做部署和应用,大模型需要有大量的剪枝和蒸馏的压缩成本。以后大模型更多的可能会变成基础设施,它本身非常消耗资源。
以上就是本期栏目的精选内容,3月21日和3月28日,OpenI启智社区也推荐了人工智能开源领域的大咖做客《人工智能开源录 | 对话OpenI启智社区》在InfoQ视频号的直播栏目,为大家做了更多技术实践的分享。欢迎大家关注和收看~