近年来,AI开源逐渐成为众多开发者谈论的核心,但也出现了不少“AI不适合开源”的声音,那么,AI项目到底适不适合开源呢?
为了解答这个专业问题,9月19日,OpenI启智社区特邀联通研究院教授级高级工程师、OpenI启智社区精品开源项目“CubeAI智立方”负责人霍龙社博士做客OpenI启智社区与InfoQ联合打造的《人工智能开源录》直播栏目,深度解读“AI项目到底适不适合开源”。
本场直播访谈由InfoQ资深编辑鲁冬雪担任主持,与霍博士就“人工智能技术到底适不适合开源”、“开源AI算能服务平台CubeAI智立方的开源历程”、“人工智能行业未来的发展”等AI开源相关话题展开访谈。直播在线观看用户量达到了近7000人,用户对霍博士的AI见解表示受益匪浅,更对OpenI特邀的每期嘉宾表示非常期待。
无关适不适合,更是愿不愿意
针对AI到底适不适合开源这个话题,霍博士认为它没有一概而论的标准答案,需要根据项目的实际情况而定。而且,开源无关适不适合,更是愿不愿意的问题。
对于开发者来说,开源能让他们在开发过程中快速的给一个项目打好基础,提高代码质量和开发效率。从公司的角度来说,开源更是一把双刃剑。公司代码是否选择开源,要从公司的经营利益以及市场竞争方面考虑正面和负面的影响,开源是否影响到公司的技术生态环境,又或者是否会让竞争对手渔翁得利,都需要站在公司的角度去考虑。
而“开源不适合AI”的声⾳是一种以偏概全的观点。比如,超大模型的开源对模型本身和开发者其实都是相互成就的过程,开发者可以从模型代码的思路、框架汲取优秀的想法,同时,也能激发开发者们给开源项目提供更好的建议。另外,借助开源算法,AI技术在落地方面可以得到更高效的推动,开发效率能够达到事半功倍的提高。对于实际生产运营的AI项目,在开源代码上进行二次开发,能够更高效的促进AI技术落地。
源于开源,回馈开源
1、CubeAI源于开源,回馈开源
2019年,中国联通为推动5G与AI融合创新,发布了CubeAI智⽴⽅平台。而CubeAI选择开源的原因,霍博士概括为“源于开源,回馈开源”。
因为在项目初期,团队通过学习借鉴美国AT&T的开源代码思路而开发出CubeAI的框架。所以团队希望将CubeAI智立方平台开源,也能够给业界生态带来积极正向的影响。
2、CubeAI为打破模型开发与实际应用壁垒而生
从⼈⼯智能⾏业发展来看,AI模型开发与实际⽣产应⽤之间存在不少壁垒。比如,大部分模型项目方的精力都集中在模型的训练开发上面,对模型的交付和用户使用体验却并未投入太多关注,以至于用户在模型使用上的体验非常糟糕。
而作为开源AI算能服务平台的CubeAI智立方却很好地解决了这些问题。据霍博士介绍,CubeAI平台不需要使用者了解任何服务器云端封装的基本原理和编程知识,只要通过平台提供的模版,就能把模型一键部署到云端,以服务化API的方式对用户提供服务。
CubeAI不仅实现了与市场上一些优秀的建模平台的对接功能,其AI模型共享还能很好帮助用户收藏部署模型。相比Github必须先下载才能后修改的静态代码,CubeAI的AI模型共享是能够将代码直接部署到云端的活体程序。同时,它的AI能力开放平台能够让用户对模型进行更好的管理,交互可视化。
而关于CubeAI后续的规划,霍博士认为作为平台型的开源软件,要想真正发挥作用,还需要做好面向公众互联网的运营。目前,CubeAI正处于开源孵化的阶段,用户群体主要面向个体AI开发者和中小型开发团队,并没有在互联网上得到实际的应用。后续,团队将根据实际的运营需求,把CubeAI打造成一款能够真正投入实用的产品。
3、CubeAI在OpenI开源孵化后的经验与感受
在谈到进入OpenI启智社区孵化的CubeAI时,霍博士认为启智社区为项目提供了一个非常好的代码托管平台,之前CubeAI的代码一直托管在github,但团队在使用了一段时间启智的AI协作平台后,很快就都喜欢上了这个平台,仿佛发现了新大陆,从此,CubaAI项目的所有代码全部被切换到了启智平台。
提到OpenI启智社区,霍博士对启智的平台性能、用户体验和社区活动都大为赞叹:第一,启智AI协作平台速度快,代码提交很流畅。第二,用户界面很友好,所有的交互都非常清晰明了。第三,平台本身也是迭代开源项目,两个礼拜会有一次更新,每次更新都会有更好的体验。另外,启智社区对CubeAI项目等孵化项目也提供了很多展示和宣传的机会。同时,霍博士还开心地提到前一段时间在OpenI启智社区无意中参与“我为开源打榜狂”活动并获奖的经历,只要提交代码达到一定次数就能拿奖金。总之,霍博士安利OpenI是一个对AI开发者非常友好的平台。
除了开源,更要多措并举
1、人人如何可以都做AI开发
如今开源AI平台越来越多,AI技术应用门槛不断降低,出现了一种“人人都可以做AI开发”的趋势。霍博士从AI应用开发的层面分析了形成这种趋势的几方面因素。
第一,是因为人工智能技术本身的发展。跟传统的机器学习相比,基于神经网络的深度学习有一个最大的优势是不需引进人工特征提取,就可以进行端到端的学习。在模型设计和算法研究层面不需要开发者和专家的参与,降低了技术层面。
第二,是因为各类开源框架的出现普及让复杂的操作和重复的计算可以被代码封装起来,制作成通用的API接口来构建模型训练和推理操作,大大降低了模型开发的难度和技术门槛。
第三,在开源框架的基础上,诞生了利用通用数据集训练的预训练模型。不同应用领域的开发者能够使用自己的数据集来进行增强或者优化预训练,得到更适合自己领域的模型参数。这样就降低了应用型模型开发的技术门槛。
第四,各类AI开源平台的出现。这些平台面向各类应用开发者直接提供训练好的模型。开发者只要进行简单的参数配置或者编排组装后就可以调用。对于应用开发者的话,他们甚至不需要学习和掌握AI的基础理论就可以进行开发应用了。
总的来说,霍博士认为想要得到良好的发展,还必须借助开源的应用生态环境,吸引大量的人来参与开发建设,而降低技术门槛是吸引开发者的必要条件。同时,降低门槛可以让大家站在巨人的肩膀上,助力AI行业发展得更好。
2、国产AI开源框架现状与未来
近几年,国内不少厂商都开源了自己的AI框架,但能做到在业界有名气的开源项目并不多或影响力不够大。霍博士认为这其中有几点主要原因:一是跟用户的使用习惯和学术生态有关。让习惯了使用国外的TensorFlow或者PyTorch框架的AI研究者转向使用国内新兴的AI开源框架不仅有很高的学习成本,且基于新的框架很难在国际学术环境上别人交流。二是因为AI开源不是一件轻松的事情,除了大量的持续创新开发人才,还要宣传运营团队,以及有强大的算力支持。长期以往的消耗,很多公司的项目无法持续下去。三是AI科学项目需要一个持续的创新。如果技术缺乏持续创新,项目将逐渐失去人们的关注,从而失去信心,也就无法坚持下去了。
尽管很难成功,霍博士认为国内厂商争相构建开源框架也能带来不同的创新和进步,大家互相学习借鉴,取长补短,能形成一种百花齐放的局面。在相应政策和市场的影响下,国内不少优秀的机构和项目都在友好合作,朝着带动国产AI开源走向行业领头的方向努力。
3、开源是促进人工智能发展的一种举措
提到行业里存在哪些技术挑战时,霍博士以CubeAI为例,介绍项目的重心主要是解决模型的发布和部署,但对于将来的部署和运营具体以什么形态呈现、如何让开发者、运营者和使用者都能得到最大的实惠和便利这些方面的技术挑战仍旧在探索。希望将来能做到技术与算法解耦合,让开发者更好的专注算法研发,而不用担心技术和硬件层面的问题。至于开源,霍博士认为它只是解决这些技术挑战中需要借助和依赖的一个机制和手段,是解决这些问题其中的一环,光靠开源远远不行,更要多措并举。
以上就是霍博士在“AI项目到底适不适合开源”为主题的访谈中分享的主要观点。在直播过程中,霍博士也热心与观众互动并解答相关问题。
OpenI启智社区(免费的GPU/NPU算力)
OpenI启智社区是在鹏城实验室的支撑下,以鹏城云脑科学装置及软件开发群智范式为基础,由新一代人工智能产业技术创新战略联盟(AITISA)组织产学研用协作共建共享的开源平台与社区。