代码自动生成,给程序员带来的是“春天”还是“寒冬”?

CodeGeeX受邀参与由AI大模型领域的青年中坚力量组织的思辨活动。在计算机编程领域,基于大模型能力的代码生成工具,探讨给程序员带来的各种机会与挑战。近期CodeGeeX 2.0大版本上线,用对话的方式直接操作代码!开发提效,推荐体验!

思辨活动背景:

AI技术的飞速发展对各个领域带来了深远的影响和变革。在计算机编程领域,各种代码生成工具的出现也对程序员们带来了重要挑战。此类工具可以通过对大量代码的学习,高效地生成高质量的代码,极大提升了代码编写的效率。不禁让我们开始思考未来的程序员们,该何去何从,是被取代还是与代码生成工具和谐共生,这都有待深思……
代码自动生成,给程序员带来的是“春天”还是“寒冬”?_第1张图片

2023年5月25日,以“代码自动生成是辅助还是取代程序员?”为主题的第四十三期大咖思辨如期举行。本次活动由AI TIME和清华校友总会AI大数据专委会主办,CodeGeeX承办,盛景网联科创汇协办。此次活动邀请了智谱AI 大模型事业部 VP、CodeGeeX产品负责人薛宇飞,华为云PaaS技术创新Lab代码智能专家申博,云起无垠创始人兼CEO沈凯文,aiXcoder COO李力行,极狐(GitLab)资深创新架构师郭旭东五位专家参与。活动中,五位嘉宾围绕代码模型、AI代码生成时代的变革、未来的软件开发等方面进行了深入探讨。本期活动共吸引了来自线上线下的专业领域观众约2.5万人次参与。

01 Open AI和Google是否有大模型的护城河?开源模式颠覆的是什么?

CodeGeeX产品负责人薛宇飞:“护城河”是一个相对的概念,不会存在永久的无法跨越的技术壁垒。不管是OpenAI还是Google,“护城河”没有想象得那么深,其他大模型公司完全有可能通过一段时间的努力追上他们甚至超越他们。开源一方面促进了大家对大模型的认知和应用,另一方面它也在推动着技术向前更好地发展。

华为云代码智能专家申博:OpenAI和Google处在大模型技术的最前沿,在共同推进这一领域的发展。开源的方式让其他公司或组织也有机会训练出可用的大模型,然而,要超越OpenAI和Google,就需要面对和突破很多未知的技术问题,而对这些细节问题的认知和经验是OpenAI和Google的护城河,也是其研究越来越封闭的原因之一。此外,高质量数据的积累也是关键因素。OpenAI较早地将大规模公开发布上线,已经积累了大量的用户数据和较高的用户粘性,这使得后期发布的模型很难再分享到用户红利,包括Google的Bard。

aiXcoder COO李力行:“护城河”是一个相对的概念,会随时间而发生变化的。OpenAI或Google目前在模型规模、数据积累、工程上的技术细节等方面都有了一定的时间积累,占据优势,这是它们的护城河。开源颠覆的是相对不那么完善的模型和应用,可以让小公司甚至独立开发者有机会体验和感受大模型。

云起无垠创始人沈凯文:信息的流动有助于创造价值。虽然OpenAI和Google本身具有一定的技术优势,但它们的“护城河”并不是无法逾越的。通过开源,其他开发者可以在短期内追赶甚至超越它们,尤其是垂直模型或者应用场景方面。然而,对于先行者而言,它们的模型在模型规模、数据集、商业地位等方面已经取得了一定的优势,后来者需要一定的时间来积累这些优势。

极狐(GitLab)资深创新架构师郭旭东:OpenAI和Google的护城河主要体现在三个方面:人才、成本和数据集。它们之所以具有优势,是因为他们更早地掌握了相关资源并布局了社区生态。然而,我对开源持乐观态度,因为,开源的颠覆是不可避免的,只是时间问题。开源让普通用户也有机会在低成本的情况下体验模型,并增加了底层力量,从而能够促进整个生态的繁荣。

02 单独的代码模型是否有必要?多大规模的代码模型才能满足需求?

极狐(GitLab)资深创新架构师郭旭东:ChatGPT时代,单独的代码生成模型是必不可少的,而这些模型往往是以语言模型为基础的。然而,由于应用场景的不同,在未来的发展中,专注于垂直领域的代码生成模型将变得更加重要。这样能够降低模型的部署成本和体积,使更多的企业能够参与并发挥更大的价值。

华为云代码智能专家申博:单独的代码大模型存在是有必要的。从应用层面来看,原因主要有两个:一是实际可用性的要求,二是编程语言的特殊性。从用户体验角度来看,用作代码生成、解释、调试的大模型应该满足低延迟、高并发、高精确性等要求,模型的领域知识、输入输出形式等都有较为明确的限制,因此需要专业的代码大模型来承载。从训练角度来看,自然语言与编程语言之间存在很大差异,不同于自然语言,编程语言实际上隐含的是一种图形式的信息,可以看做与自然语言不同的另一种模态,这决定了代码专用大模型的架构和训练方法可能与自然语言需要有所不同。总之,单独的代码大模型存在是有必要的,但实际的软件开发需要同时具备计算机知识与世界知识,代码大模型最好要在通用大模型的基础上派生。

CodeGeeX产品负责人薛宇飞:有了通用的大模型之后,专门的代码模型还是有必要存在的。在代码生成和补全方面,用纯粹的代码模型能够保证响应速度,并且可以降低推理成本。我们目前也在探索使用通用模型解决代码解释相关的问题,因为它在自然语言方面的能力更强,可以更好地解释代码,这两种模型都有各自适合的应用场景。在目前来看,百亿是代码生成模型较适合模型的规模。

aiXcoder COO李力行:在代码领域,确实有必要拥有专门的代码大模型,并且我们应该基于自然语言的基础构建代码模型。代码模型对模型推理、计算资源有特殊的要求,因此将其它冗余的信息与代码模型结合起来是没有必要的。代码语言具有独特性和语法限制,因此,在代码模型的结构上也值得进一步探索。关于代码规模的问题,“够用”是一个很难定义的概念。目前来看,百亿级或者千亿级的大模型能够达到不错的效果,能够解决现实的问题。

云起无垠创始人沈凯文:在代码领域,确实应该存在独立的代码大模型。这可以分为两个阶段来看待:在AGI出现之前,我们可以将人类的需求分为通用需求、专业领域、长尾需求,其中长尾需求还是需要人类去进行调控的。在AGI出现后,它有可能真的取代程序员的工作。在某些场景中采用垂直的模型能降低资源消耗,对独特领域能赋予更多的知识,有更准确的结果。因此,专注于独特领域的模型可以更好地满足特定需求,并提供高质量的解决方案。

03 AI代码生成时代会产生哪些变革?

云起无垠创始人沈凯文:低代码平台因其易用性和灵活性,更容易被广大用户接受和应用。然而,产品的付费与否并不是衡量其质量的关键因素。付费的产品要能够给用户创造价值,而免费的产品最终需要找到适合的盈利模式,以便在维护和研发方面保持可持续性。在使用代码生成模型时需要考虑到不同的应用场景,使其能真正满足用户需求,并发挥其应有的意义。

极狐(GitLab)资深创新架构师郭旭东:目前,国内外发布的各种大模型在能力上存在差异,它们的作用相互冲突且局限于很小的语言范围内,对代码的上下文理解能力有限,无法有效解决实际问题,这也成为后续发展的一个需要解决的方向。Copilot采用的订阅制收费策略为用户接受新模式提供了机会,这是一个进步,并且在未来将会持续发展。随着竞争加剧和成本降低,开发者将推出更好的功能。目前,我们已经将代码生成模型应用到了软件开发的多个方面,例如代码注释、代码检查和功能总结等,这降低了获取信息的门槛,提高了研发效率。

aiXcoder COO李力行:免费本身是一种商业模式,我认为Copilot目前的收费策略是为了区分用户,将有限的资源留给真正需要的人。对于代码生成模型的使用,是一个逐步适应和提升效率的过程。目前,大多数人停留在Demo层面,仅通过自然语言描述就能生成一个方法或代码。另外,从培训和教育用户的角度看,它也给很多零基础的人提供了感受AI魅力的机会。在实际开发的过程中,它可以作为编程的辅助伴侣,节省时间并提高效率。那么在后期,我期待产生一种新的编程交互方式,在写代码的过程中辅助模型提问、解释、自动定位bug或者有更高阶的应用。

CodeGeeX产品负责人薛宇飞:AI代码生成应用的商业模式不会再聚焦在个人用户身上,而会转向企业用户付费。很多用户在使用AI产品的时候往往有更高阶的要求,现在的代码生成模型在满足用户需求方面是有局限的,这是未来AI编程要努力的方向。使用者也需要更详细地了解AI产品的特性,才能更好地辅助自己工作提高效率。

华为云代码智能专家申博:大模型将会对所有软件开发工具和其商业模式带来变革。未来AI加持下的软件开发工具应该会形成免费和收费并存的模式。免费提供代码生成功能对于用户和工具开发者来讲都是有益的,它降低了使用门槛并扩大了市场,使得更多人可以上手尝试并探索有趣的使用场景;但是,仅凭借代码生成进行收费是不够有竞争力的,开发者的日常工作除了代码编写,还有测试、交付、维护等更加耗时的工作,这些比代码生成的应用场景更丰富,也更有可能对开发效率和质量带来正向收益。因此,在代码生成这一基础需求之上,更具体的高级功能和定制化需求,例如智能测试、知识问答、错误调试、安全问题或开发规范扫描等,才是具有付费价值的差异化点,用户可以根据自己的实际需求实时选购。

04 对未来软件开发的畅想

云起无垠创始人沈凯文:希望未来的大模型可以提供一些辅助,人类进行微调和优化。

aiXcoder COO李力行:未来一个人可能具备一个团队的能力和功能,活成一个团队。

华为云代码智能专家申博:软件研发领域是AI提升生产力最有潜力的方向之一,未来每个人都有可能成为某种程度上的软件开发者。

CodeGeeX产品负责人薛宇飞:未来编程语言可能不复存在,只需人类用自然语言描述就能产生可以运行的程序。

极狐(GitLab)资深创新架构师郭旭东:在短期内会涌现出更多的全栈工程师,希望未来能够产生完全不需要人工介入的人工智能工具。

始智AI创始人刘道全:虽然大模型有可能替代一部分工作,但更好的情景是辅助人类完成工作。

AITime何芸:大模型推动了人类的进步,在未来可以让人类释放一部分精力,将时间投入到提升自己的领域。

你可能感兴趣的:(代码自动生成,给程序员带来的是“春天”还是“寒冬”?)