登上CMMLU性能评测榜单第一 四大维度解码夸克自研大模型

11月14日,拥有千亿参数的夸克自研大模型正式发布,立刻占据CMMLU榜单第一名。夸克大模型将应用于通用搜索、医疗健康、教育学习、职场办公等多个场景。性能方面,其整体水平已经超过GPT-3.5,其中在写作、考试等部分场景中可以超过GPT-4,成为国产大模型中名副其实的“学霸”。

登上CMMLU性能评测榜单第一 四大维度解码夸克自研大模型_第1张图片 

评测成绩显示,夸克大模型在发布后一举登顶

CMMLU榜单,平均分达到77.08分,在社会科学和其他两个类别中分别斩获第一。在国内专业考试测试中,夸克大模型取得高考满分的成绩,还通过了临床执业医师资格考试。一系列优异成绩的背后,是夸克在大模型技术研发方面的战略定力与持续投入。经过多年发展,夸克积累的四方面优势,才是培养出这位“新学霸”的原动力。

首先,夸克大模型拥有的海量数据优势,基于智能化的搜索能力和自然语言处理技术,夸克拥有最完整的中文数据库,在每天数以亿计的信息处理后,能更好地理解、评估、提炼中文知识体系,了解不同用户对工作、学习、生活上的真实需求。这些搜索请求和大数据也组成了夸克大模型的第一层优势。

第二,夸克在教育、医疗、文档等垂直领域上的优势可以继续在大模型领域发挥作用。目前,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,沉淀了非常丰富的数据及用户场景,无论是考试资料还是硬核知识,夸克都构建了一套完整的知识内容体系,在大模型原生应用落地的过程中,将进一步提升用户效率。

第三,夸克通过技术能力可以更好地识别知识正确性。尤其在通用知识、图文知识、专业知识、推理知识、写作增强等方面,夸克建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系,让大模型提供的内容更具有准确性和专业性。

第四,就是夸克的平台优势。据悉,为了实现全栈自研的技术路线,夸克搭建数百人规模的独立产研团队,每天处理过亿级别的实时数据。同时,在搜索、教育医疗垂直业务,有行业团队会根据用户需求的变化,进行大模型的预训练与精调,以帮助用户解决生活中面临的实际问题。

在国内大模型赛道持续火爆的当下,夸克为什么能做出千亿级参数的自研大模型?夸克技术负责人表示,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。

作为近年来成长速度最快的互联网产品之一,夸克App在跨场景应用上引领行业风向。根据QuestMobile发布的《2023年轻人群智能效率应用研究》报告显示,夸克App在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一。

去年底ChatGPT掀起新一轮人工智能热潮以来,业内就有观点认为,以搜索为代表的信息服务场景是大模型开发及应用的最佳平台。大模型产品仍在跑马圈地,夸克大模型依托四大优势,发布千亿级参数的大模型,或将开启AIGC信息服务新风向,更精准、高效地满足用户解决实际问题的需求。

你可能感兴趣的:(人工智能)