伴随着ChatGPT的火爆全球,数以百计的大语言模型也争先恐后地加入了这一战局,掀起了一场轰轰烈烈的“百模大战”。毋庸置疑的是,继方兴未艾的人工智能普及大潮之后,生成式AI与大语言模型正在全球开启新一轮生产力革新的科技浪潮。
在这场生成式AI的大潮中,东软集团也正式宣布成立东软魔形科技研究院,持续探索人工智能技术的创新与应用,推动实施大语言模型系统工程战略,全面迎接大模型时代的机遇与挑战。
生成式AI为什么会以如此惊人的速度火爆全球?它会给技术人员带来怎样的变化?东软集团在生成式AI领域又有着怎样的布局?刚刚成立的东软魔形科技研究院又肩负着怎样的使命?近日在东软解决方案论坛2023上,东软集团高级副总裁兼首席技术官、首席信息官陈锡民博士对以上问题给出了详细的解答。
生成式AI为什么如此火爆
陈锡民向趣味科技表示,生成式AI与大语言模型之所以,是因为它们可以做好以前许多人工智能技术做不好的事情,譬如对自然语言的理解,对文章的要点归纳,除此之外,其强大的生成能力也可以极大地提高用户的工作效率,让人们可以把有限的时间精力投入到更具有价值的地方去。
1、渗透力强:与元宇宙等其他技术相比,生成式AI可以更加普遍地渗入到人们的日常生活当中。它不仅仅依赖于特定的设备或装备,而是能够通过各种方式和渠道影响人们的生活。这种普遍性使其更加容易被人们接受,并在社会中产生更加广泛的影响。
2、解决关键技术问题:大语言模型解决了过去人工智能应用中的关键难题,即思维能力和生成能力。过去的人工智能更多地是决策式AI,只能做一些判断和识别,譬如图像识别和语音识别,但是缺乏更深层次的理解和生成能力。而大语言模型的出现填补了这一空白,使得生成式AI能够通过语言交互更加深入地理解用户意图,并产生相应的输出。
3、类似人类大脑中枢:大语言模型的运作方式与人类大脑中枢的运作方式有着一定的相似之处。它可以接受语言输入,理解并产生输出,这种输出可以是文本,也可以是进一步分解的行为、动作和其他指令。这使得大语言模型不仅仅是一个简单的工具,而是一个能够理解、思考和指导各种动作的智能系统。
4、裂变效应与无限可能:结合思维链的方式和提示工程的能力,大语言模型的能力可以被无限放大和嵌套。譬如一个AI可以生成两个子AI,分别执行不同的任务,并能够继续产生更多的子AI。这种裂变效应带来了巨大的想象空间,因为这意味着AI可以自我复制、自我监督、自我协同,实现任务的并行处理和高效完成。
“总的来说,生成式AI与大语言模型,对社会和技术带来了非常巨大的潜在影响。它们不仅仅是一个工具或者一个系统,而且还是一个能够思考、理解、指导和裂变的智能体。这种技术带来的变革可能会超越我们的想象,并给未来的生活和工作方式带来全新的定义和可能性。”陈锡民表示。
大语言模型给技术人员带来的变化
由于新兴的生成式AI与大语言模型,与以往的传统人工智能技术是如此的不同,所以它们的快速普及,也给既有技术人员的岗位分工带来了巨大的震荡。
陈锡民指出,过去在IT行业,代码是否写得漂亮、算法研究是否深入,这些是人们评价一位技术人员能力高低的主要标准。然而随着生成式AI技术的发展,特别是大语言模型的出现,对技术人员的要求已经不仅仅是编程和算法研究的能力,而更重要的是如何与人工智能打交道,如何理解和驾驭知识,并将其活化为对人工智能的指导和应用。
这种对技术人员角色和能力要求的变化,实际上是一种从技术细节驾驭到知识驾驭的转变。技术人员需要更加深入地理解业务、理解知识,才能更好地利用生成式AI与大语言模型等技术为业务赋能。这种转变对技术人员的能力提出了更高的要求,需要他们具备更广泛的知识、更深入的业务理解以及更强大的创新思维。
对于企业来说,如何培养和吸引这种新型的技术人才,也成为了一项非常重要的课题。一方面,企业可以通过培训和内部转岗等方式,帮助现有的技术人员适应这种转变;另一方面,企业也需要从外部引进具有新知识结构和技术能力的人才,以推动自身的技术发展,更好地满足客户的需求。
对于这种新生的变化,技术人员自身也需要积极适应和快速学习。不仅需要提高自己的业务知识和理解能力,也需要学习新的技术和工具,譬如提示工程、微调技术等,以更好地驾驭生成式AI与大语言模型等新兴技术。
“总的来说,生成式AI与大语言模型等技术的发展,正在深刻改变IT行业的技术人员岗位分工和能力要求。而对于技术人员来说,这既是一个挑战,也是一个机遇。只有积极适应这种变化,不断提高自己的能力,才能在新的时代中立足。”陈锡民说道。
东软在生成式AI领域的布局
陈锡民向趣味科技透露,东软在生成式AI领域的布局具有非常清晰的目标和方向,将主要聚焦于行业大模型的构建和应用。由于通用大模型的训练成本非常高,所以东软选择利用开源模型为基础,结合行业数据和行业知识,来训练具备实际应用价值的专业大模型。
目前,东软正在围绕医疗、政府、汽车等三大重要的业务板块,构建生成式AI解决方案。其中,医疗领域的医生助手和问诊助手是两个典型的应用场景。医生助手可以自动生成医嘱和病历,提高医生的工作质量和效率;而问诊助手则可以帮助患者更准确地挂号和描述病情,提高医疗服务的效率和质量。这些应用场景都具有较高的落地可行性和应用价值。
值得注意的是,东软在构建行业大模型时,不仅考虑算法和模型的性能,也非常注重与社会责任和法律责任的结合。陈博士指出:“人工智能只是起到辅助作用的工具,最终的法律责任可能仍然由人来承担,因此我们要对产品更加谨慎。”这种注重社会责任和法律责任的做法,也有助于保障人工智能技术的安全和可持续发展。
值得一提的是,东软最近还面向医疗领域推出了多款AI+医疗行业应用,包括添翼医疗领域大模型、飞标医学影像标注平台4.0、基于WEB的虚拟内窥镜等。这是东软凭借深厚的技术积累、海量的数据资源、丰富的行业应用场景,在AI+医疗行业的创新实践,加速推动了东软“AI+领域应用”的人工智能生态图谱战略布局。
“虽然生成式AI与语言大模型在自然语言理解方面已经有了很大的进步,尤其是百亿、千亿参数规模以上的通用语言大模型。但是在医疗、法律等严谨行业中的应用,我们仍然需要非常谨慎。因为这些行业涉及人的生命、财产等核心利益,一旦出现错误,后果可能会非常严重。这就需要我们通过一系列的系统工程,确保大模型的输出质量和价值观的正确性,从而真正实现人工智能技术的安全和可持续发展。”陈锡民表示。
东软魔形科技研究院的使命
谈到最新成立的东软魔形科技研究院时,陈锡民表示,该研究院的诞生是以“智能化软件生产”和“软件智能化服务”为核心目标,并将启动和实施东软“大语言模型系统工程(LLM Systems Engineering,LLM-SE)”战略,围绕“专业性、一致性、可解释性、安全性”等企业级应用的核心特性需求,打造东软LLM-SE通用开发平台,面向医疗、人社、医保、政务、金融、媒体、人力资源及智能汽车等所有业务领域,构建东软LLM-SE+领域应用,完成典型场景落地部署及大规模推广,为东软AI大模型驱动的业务转型提供全面支撑。同时研究院还将积极打造外部合作生态 ,建设东软AI算力中心、AIGC相关技术的应用研究,构建东软完整的人工智能生态体系。
陈锡民指出,东软魔形科技研究院的成立肩负着多个重要使命,并且与东软集团作为行业软件领军企业的战略定位紧密相关:
1、跟踪与消化先进技术:当前大语言模型技术正处于快速发展和演进阶段。东软魔形科技研究院的首要使命是持续跟踪这些先进技术,并进行消化学习,确保东软始终保持在技术前沿。
2、探索行业应用场景与技术方案:作为行业软件厂商,东软需要深入探索大语言模型在各个领域的应用场景和相应的技术方案。特别是在东软关注的医疗等重点领域,由于数据的敏感性和保守性,需要自主研发符合行业需求的大模型。
3、商业化导向的研究:东软魔形科技研究院不仅致力于技术研发,而且还要确保研究成果能够商业化。这就需要研究出的模型在质量上可控,并且在部署成本和运行成本上都要合理,这样才能真正满足客户需求并实现商业化价值。
4、联合各业务单元共同研发:东软魔形科技研究院的特色在于它与各纵向业务单元紧密合作。各行业领域的专家和技术骨干带着课题进入研究院,共享算力、环境等资源,结合通用大模型的认知能力,共同进行相关课题的研发。
5、发挥模型孵化器作用:东软魔形科技研究院还起到了模型孵化器的作用。它负责对未来行业大模型的训练、实践验证及商业化全流程。一旦模型孵化成功,即可进行商业化销售,为东软带来实际的经济效益。
“综上所述,东软魔形科技研究院的定位是一个集先进技术跟踪、行业应用探索、商业化导向研发和模型孵化于一体的综合研究机构,它为东软在未来生成式AI与大语言模型领域的发展,提供了坚实的技术基础和源源不断的创新动力。”陈锡民说道。