中国最强AI研究院的大模型,为何迟到了?

中国最强AI研究院的大模型,为何迟到了?

中国最强AI研究院的大模型,为何迟到了?_第1张图片

这篇文章探讨了智源研究院发布开源大模型的迟到原因。6月9日,在北京举行的2023年智源大会上,智源研究院发布了全面开源的悟道3.0,包括视觉大模型系列“视界”、语言大模型系列“天鹰”,以及独创的大模型评测体系“天秤”。然而,在当前大模型热潮中,智源研究院却保持了异常低调。

在过去三个多月里,除了与Meta的抠图AI“SAM”相撞的事件外,智源研究院几乎没有向公众透露任何与AI大模型相关的信息。这引发了人们的疑问:作为一个在AI大模型领域领先的研究机构,智源为何在大模型的高潮时刻似乎来迟了?

文章指出,智源研究院发布开源大模型需要更加谨慎。开源模型意味着公开模型代码,供AI开发者研究使用。智源研究院在发布之前需要对模型进行反复验证,并经受大量开发者的挑战,以确保模型的质量。这可能导致智源研究院在研发进程上相对较慢。

另一个原因是,智源认为目前国内市场上大模型的开源开放力度还不够,他们呼吁进一步加强开源开放。开源模型的发布可以促进科研创新和加速产业落地,避免重复训练和重复开支。智源研究院希望通过开源模型积累用户反馈,提升大模型在工程上的可用性。

另外,文章提到智源的悟道3.0是一套完全重新开发的大模型系列。与之前的版本相比,悟道3.0在模型技术方向和底层训练数据上都进行了调整和改进。智源研究院重新开发模型的原因是为了采用更新的架构和优化的训练数据,提升模型的性能和质量。

最后,文章提到智源研究院的训练数据存在一定的短板。与互联网大厂相比,智源缺乏用户侧的交互数据和可用的版权数据。他们通过与版权方协商和公益数据项目的采集积累训练数据。然而,智源的中文数据集目前只能部分开源,主要是因为中文数据的版权分散在各个机构手中,智源只能获得针对开源模型研究的使用权限。

综上所述,智源研究院发布开源大模型迟到的原因包括谨慎发布、开源模型的谨慎验证、国内市场开源力度不够、技术方向和训练数据的调整、以及训练数据的短板等因素。这篇文章揭示了智源研究院迟到的背后原因,为读者提供了深入了解智源研究院和开源大模型的观点和解释。


你可能感兴趣的:(人工智能,科技咨询,ai,科技,人工智能)