对话天壤创始人薛贵荣:AIGC正在成为新的“水煤电”

AIGC正在悄无声息地成为各行各业的必需品。

 

@数科星球原创

作者丨苑晶

编辑丨大兔

 

国内的大模型混战半年有余,传统互联网巨头和人工智能公司纷纷入场。在“百模大战”的关键时刻,行业悄然发生分化。一些更具前瞻性的企业开始眺望远方,准备打一场“非对称”的商业竞争。

 

在已闭幕的2023世界人工智能大会中,上海天壤智能科技发布“天壤小白”大模型产品“三件套”,包含通用语言大模型、应用开发平台和语义搜索引擎。其中,天壤小白语言大模型参数规模达1860亿。

 

自2018年成立,天壤一直专注于通用人工智能的研究。目前,公司主要服务于企业服务、数字金融、生物科技、城市运行等数字化场景。在与数科星球(ID:digital-planet)深度交流时,天壤创始人兼CEO薛荣贵认为,AIGC技术已经成为新一代的“水电煤”,人工智能企业的大量涌现将重塑未来的商业格局。

 

01

 

生成式内容技术的潜力

 

在通向AGI时代的过程中,语言大模型正在扮演着极其重要的角色(虽然AIGC技术包括但不限于语言大模型,但后者的重要性却非常大)。逻辑上,语言大模型是撬动人与机器交互的前提,目前已在文本生成、机器翻译和对话系统中得到了充分应用。

 

可以想见,在图像生成、语音生成和3D引擎不断完善后,AIGC的应用领域和能力也会不断扩展和提升。

 

在众多大模型产品中,天壤小白的优势在于多轮对话和逻辑推理。

 

在大模型行业,多轮对话有助于理解当前对话的意图和意图背后的逻辑关系,从而生成更加准确的回答。这可以被看作是实现更加智能化的交互和服务的钥匙。在技术上,由于天壤小白可以建立起对语言的长期记忆和上下文感知,从而更好地应对人类的自然语言交流和表达需求。

 

在薛贵荣的理解中,大模型的逻辑推理正在改变行业规则。“以往,我们也曾尝试小模型,但在提示词的背景下,一个知识面不宽的模型所得到的结果也是不丰富的。”另外,小模型对多轮对话的支持也较为有限。

 

此外,天壤小白还结合了思维链技术,技术上,它可以通过将一个复杂的任务分解为多个子任务,并在不同的层级上并行处理这些子任务,从而提高整个任务的效率和准确性。

 

具体来说,当一个大型的深度学习模型需要完成一个复杂的任务时,它通常会被设计成由多个子模块组成,每个子模块都负责处理一个特定的子任务。这些子任务可以是图像分类、目标检测、语音识别等。

 

在推理过程中,这些子任务被独立地处理,每个子模块都使用不同的数据和参数进行分析。当所有任务处理完成后,它可以将这些子模块组合起来,形成一个完整的任务解决方案。

 

天壤内部的技术人员认为,这种思维链技术可以帮助拆解复杂的任务,并将其分解为多个可管理的子任务。这使得整个任务的训练过程更加高效,并且可以在多个子任务之间共享知识和经验,从而提高整个模型的性能和准确性。

 

“总之,大模型的理解力、推理能力和分析能力非常不一样。”他总结。而这,也是天壤持续推进大模型业务的原因所在。

 

02

 

AIGC在智能交通中的应用

 

众所周知,AlphaGo的出现是强化学习领域的一个重要里程碑,它的成功表明了强化学习在解决复杂问题方面的巨大潜力。其通过与自己不断对弈,逐步提升自己的水平,从而在复杂的围棋棋局中做出最优决策。这不仅在围领域引起轰动,更进一步打开了人工智能赋能各行各业的全新可能性。

 

正是受此启发,薛贵荣和天壤团队燃起对AI的信心,自研AI围棋TRgo,仅用AlphaGo 1% 的计算资源,成功击败了世界围棋冠军朴廷桓,成为国内率先探索强化学习的团队之一。

 

不仅在围棋领域有所斩获,2020年,天壤在交通行业取得重要进展。天壤推出了城市级交通拥堵治理系统TRTraffic,并助力南昌成为全国首个“交通不限行”城市。

 

然而,天壤在探索通用人工智能和训练大模型的路上,也面临着缺数据的难题,就像今天的中文版ChatGPT,高质量的中文语料数据十分稀缺。对此,天壤寻求创新,利用机器人对抗生成数据、优胜劣汰迭代优化模型,以及利用强化学习进行数据增强等。

 

这些方法使得模型效果大幅提升,也证明了强化学习在应对不同挑战方面的优越性能。

 

现在,随着AI技术的进一步突破,他更加看好AI在感知、认知和决策的进步。“我们可以用人工智能解决复杂场景下的应用。”薛贵荣对数科星球(ID:digital-planet)这样说。

 

天壤内部技术人员称:“人工智能可以帮助城市向不限行城市发展,在这之中深度学习、强化学习技术可以运用其中。”

 

03

 

各行业大模型的应用

 

除了在语言大模型方面取得突破,天壤还将领先的AIGC技术应用于生物制药领域,为该领域带来了巨大的潜力和机遇。

 

原理上,AIGC可以生成全新蛋白质,甚至,生成的蛋白质可以完全不同于自然界中的天然蛋白质。

 

在结果上,新的技术极大地缩短蛋白质研究的时间和成本,开辟了计算生物学研究的全新范式。在目前来看,已应用的技术可以避免传统的蛋白质设计方法中的繁琐和不确定性,同时也可以大大提高蛋白质的质量和稳定性。薛贵荣对数科星球(ID:digital-planet)称:“生物科技产业将进一步爆发,其中AIGC将会成为下一轮爆发的技术底座。”

 

2021年,该公司发布蛋白质结构预测模型TRFold2,基于CASP14测试集的预测精准度媲美AlphaFold2。2022年,该公司发布蛋白质设计模型TRDesign,实现按需设计蛋白质,具体项目中则包括:

 

发布蛋白质复合体结构预测模型TRComplex;

 

发布孤儿蛋白质结构预测模型TRFold-Single;

 

打造国内首个蛋白质设计工作台xCREATOR。

 

与其说,“判别式AI”是基于数据做出判断,那么生成式AI则因上下文思考能力,拓展了AI在决策之时的思考边界。

 

宏观上,AIGC所需要的算力、算法、中间件技术和数据会激发一轮新的投资热潮;行业中,各行各业结合AIGC将加速智能化的普及速度;微观上,拥抱智能化速度更快的企业能够获得新的市场竞争力。

 

04

 

开放平台背后的价值

 

大模型虽好,但不是任何企业都可以做。其中,一大原因是,打造用户-数据-能力三位一体的增长飞轮,极具挑战:

 

首先,多样化的用户需求和反馈可以帮助大模型不断优化和改进。大模型的迭代和改进需要不同用户的需求和反馈作为指导,用户可以通过使用大模型来发现其存在的问题和不足,并向模型开发者提供反馈和建议。这些反馈和建议可以帮助模型开发者更好地理解用户需求,并针对性地进行模型的改进和优化,从而提高模型的性能和准确率;

 

其次,数据是大模型迭代和智能涌现的基础。大模型需要大量的数据来进行训练和优化,只有拥有足够的数据,模型才能够不断地迭代和改进。同时,数据还可以帮助模型更好地学习和理解自然语言和知识,从而提高模型的智能水平和表现能力;

 

基于上述两点,可以看到,大模型能力的提升是一个由真实的用户反馈和高质量数据迭代构成的双轮效应。两者缺一不可,共同推动大模型的智能涌现和发展。

 

薛贵荣认为,ChatGPT3.5-4.0的迭代就是上述逻辑的典范。为了能更快赶上国外先进水平,天壤制定了开放平台的策略以应对挑战。

 

7月7日,天壤发布“天壤小白”开放平台。该平台内置其自研大语言模型,并将一整套工具和资源整合至平台内。据了解,该平台旨在帮助开发者轻松创建AI应用,更灵活地探索大模型,创造体验更好、超越期待的AI创新产品。

 

而针对目前大模型落地的关键瓶颈:大模型的“幻觉”,即一本正经地胡说八道、私有数据的安全、市场缺乏企业级的中文大模型,以及大模型自身的封闭性问题,天壤则推出“三件套”:即大语言模型、语义搜索引擎和开发平台。这三者构成了一个开发智能应用的全栈式支持体系,为开发者提供一站式的解决方案。

 

首先是通用语言大模型,通过1860亿参数的深度学习训练,具备类ChatGPT的能力,能够进行多语言的对话互动、知识问答、逻辑推理等核心功能。它能够理解复杂的上下文信息,并根据先前的对话内容做出精准回应。

 

其次,是语义搜索引擎,它进一步强化了大模型的生成能力。在生成文本前后,该引擎会检索相关事实信息,对输入和输出进行验证,以确保内容是正确、合理、完整和一致的,避免大模型产生“幻觉”,或者提供错误或无意义的回答。实际测试中,天壤小白的语义搜索模型召回率有着十分出色的表现。其中在与OpenAI的语义搜索引擎TOP1和TOP3的召回率(分别统计召回的TOP1、TOP3个结果中包含正确答案的概率)对比测试中,天壤小白的结果为77%和86%,均超过OpenAI 73%和85%的表现。

 

最后,是应用开发平台,其采用可视化的界面,所见即所得,用户在平台左侧栏目输入预置的提示词(prompt)后,当即就能在右侧栏目测试应用效果,确保应用效果符合预期。整个创建过程耗时不超过十分钟。

 

目前来看,该开放平台极大降低了用户使用门槛,即便没有编程基础也可以通过可视化的操作界面实现应用配置。据开放平台内部员工介绍,开发者可以根据不同场景和需求,选择不同参数和精度的多元模型服务、配置提示词参数和交互类型,以及利用文档集功能进行语义检索,从而助力用户创造超越期待的AI应用,使应用效果达到最佳状态。

 

用户也可以根据具体需求,选择调用其他大模型或企业私有模型等。

 

结尾:在深度对话中,数科星球(ID:digital-planet)听到多位企业家承认OpenAI具有一定程度的先发优势。

 

但在国内,随着数据沉淀和强化学习技术创新,大模型的迭代效应正在展现。

 

用薛贵荣的话来评价便是:“掌握更多的优质数据才能更加逼近人类智能。”现在,天壤的破局点是继续加大对大模型的投入以实现规模、深度、广度的全覆盖。

 

作为一家技术型企业,天壤已初步展现出其能挑战AlphaFold的潜力,并在AI围棋、智能交通、生物科技等领域有着前沿突破。

 

时间在中国企业一边,或许,在未来我们可以见证更多的优秀企业出现。而如今,我们正在一步步走向智能时代。

 

 

你可能感兴趣的:(人工智能,语言模型,AIGC,AIGC,chatgpt)