国内百模大战,已经来到白热化阶段。
前段时间,一项国内大模评测引发众人关注。
MIT科技评论基于最新国内大模型进行横向测评结果显示,讯飞星火大模型2.0以总分81.5分、6个大类第一的成绩,获评为“最聪明”的国产大模型。
此次评测使用的数据集包含了覆盖语言专项、数学专项、理科综合、文科综合、逻辑思维、编程能力、综合知识、安全性8个大类600道题目。
其中,讯飞星火大模型2.0在编程、逻辑思维、数学专项、语言专项和综合知识上表现出色。
这样来看,集语数英编程等多项能力于一体的讯飞AI学习机,也是最能体现星火大模型实力所在。
于是乎,为了直观感受大模型能力,量子位决定上手开箱测评一波。这也是首次大模型教育类产品开箱。
搭载了“最聪明”大模型的科大讯飞AI学习机会否是“最聪明”的学习机呢?
随着星火大模型的几次迭代,讯飞AI学习机T20系列、Lumie10系列率先完成了7大功能升级——
目前涵盖英语口语陪练、中英作文批改、数学互动辅学、百科自由问答、亲子教育助手;
以及最近星火V2.0多模态和代码能力的更新,学习机也相应搭载了智能编程助手、创意绘画伙伴。
主打就是一个1V1的陪伴。
话不多说,直接上手。首先一打开学习机,就需要设置年级(横跨从小班到高三)和地区。根据年级地区的不同,会有相应不同的功能和教学界面。
嗯,幼儿园跟高中简直就是两种画风。
(为了节省篇幅,咱们就挑最具代表性的几大功能)
首先Talk Talk,英语口语陪练。你可以选择想要练习的话题,当然也支持自定义,就可以开启多轮对话模式了。
比如,就喜欢运动这个话题,它会率先开始:
(可以选择难易程度以及英美口语,真人还是界面聊天)
根据问答内容,然后展开多轮对话。要是一时间不会了,还可以用中文或者旁边提示。
事实上,这个功能其实并不陌生。作为大模型赋能教育率先应用场景之一,像海外Speak App,就被OpenAI重仓投资。
不过跟Speak不同的是,这个更专注于学生场景,对话过程会实时打分评测,对话结束还会给出评测报告。评测维度包括语法、发音、词汇使用、准确度、流畅度等。
据介绍,背后还采用的是中高考同源技术和标准。每年科大讯飞都在为全国中高考英语口语考试提供语言评测服务,累积服务6500万考生。
接着,就来说说数学互动辅学功能。科大讯飞AI学习机的个性化精准学一直是讯飞的看家本领,基于多年来积累的教育大数据,开发了一套完整的“诊-学-练”系统:
诊:通过几道题,快速找到薄弱项
学:3-5分钟知识点微课视频,针对性学习,抓住孩子注意力
练:针对薄弱项举一反三进行练习,基础、变式、拔高层层递进
有了大模型的加入,讯飞的精准学系统还可以互动点拨,AI真的像私人老师一样一对一引导孩子。
不同于以往传统学习机按章节划分学习,这里不仅有章节,每个章节还有生成的知识图谱。
知识图谱被分为基础、进阶、拔高三层难度。每做完题目,给你批改解析的同时,知识图谱就会实时更新,不同颜色代表着你的掌握程度。
随后你就可以对症下药,开启巩固练习模式。根据你的掌握程度不同,AI还会个性化地设置题目,直至你真正掌握。
不像以前拿着课本一看错题就全章节知识点巩固,浪费时间还效率不高。
再来看看最新升级的编程助手——AI编程空间,可支持代码自动生成、诊断、运行。据介绍也是业内首次实现。
比如说一句:帮我生成一段冒泡排序算法,需要呈现每一步排序过程。结果是秒秒钟就可以呈现出来~
除此之外,它还支持代码诊断,比如语法错误、运行错误、逻辑性错误等。没有问题之后就可以成功运行。
整体来看,依托于大模型的迭代,学习机AI功能也是一步一步得到升级拓展。
从最开始单一模态生成,比如口语教学、中英作文批改、数学互动辅学、百科自由问答……这些针对传统学科的定制化教学。
今天我们做的是一个大模型落地的教育产品的开箱,讯飞AI学习机能做到这些当然不仅仅是因为大模型,背后还有19年的教育大数据的积累。
如果说大模型是一个非常聪明的大脑,那喂进去的这些数据就是它学习的来源。而讯飞喂进去的这些数据来源于全国5万所中小学、来源于他们给中高考提供机器阅卷、来源于1.3亿师生真实作答数据。
到后面,学习机不再仅关注学生,家长也可以加入进来——亲子教育助手。
背靠讯飞星火大模型,可以一对一对话帮助家长答疑解惑,比如亲子沟通、亲子互动、行为习惯等方面提供建议和帮助。
要是实在不知道如何交流,还有高情商父母话术生成。嗯,可以说是很贴心了。
像亲子互动方案策划、儿童故事创作、故事续写……这些大模型本身擅长做的事情,根本也不再话下。
而随着大模型多模态能力、代码生成能力的加持,学习机进一步升级,学生更多个性化学习需求也得到满足。
像创意画板,AI助手能看懂所画内容,并根据内容引导孩子去主动分享背后的故事。除此之外,过程中还能时不时传授知识。
表面上看,5月6日上线以来,讯飞AI学习机升级7大功能。但实际也代表着:
搭载了大模型的学习机,不断拓展着能力的外延。
未来,随着大模型等技术不断迭代,更多设想的场景或许可以实现。
比如在元宇宙里,大模型化身3D虚拟人老师。甚至还可以带上VR眼镜,手把手沉浸式,真·1V1教学。
过去一段时间,国内外大模型涌现,百模大战甚至千模大战开始拉响。
但不被注意的是,以学习机为代表的传统消费电子产品,已经开启新一轮范式变革。
第一代学习机是类似于文曲星的电子词典,场景和功能都比较单一;第二代学习机主打的就是视频学习,学科拓展到了更多主流学科,学生们用来跟读、上网课。
但这种形态始终没有挣脱出被动学习和应试化教育的壁垒。而移动互联网、5G、信息化等技术的发展,也逐渐填补了教育资源的缺口。
随着更多AI技术的引入、尤其在大模型的加速下,新一代学习机也就应运而生。
可以看到的学习工具形态本身没有变化,但使用方式完成了质变,跟读、看课已经成为过去式,AI给了学生个人辅学工具更多可能性。它更聪明、更懂学生,不仅实现了因材施教、还提高了效率。
比如就从讯飞AI学习机看到,它可以根据学习进度、对知识的掌握程度进行可视化,让学生直接真多薄弱项进行强化学习。于学生而言,这也就节省了更多时间去做想做的事情。
而且在具体学习科目上,也可以看到学习就像过关斩将、玩游戏一样简单,也这也改变了以往看课的学习模式——
学生从被动接受知识到主动去探索知识,从标准化教学到个性化教学的阶段。
事实上,也不只是学习机,更是整个教育行业正在面临着这样的范式变革。
因材施教是教育行业中被广泛接受的理念以及从古至今的目标。早在上个世纪八十年代,著名教育心理学家Benjamin Bloom在其教育实验中提出”two sigma”理论证明了其正确性——
接受一对一辅导的教学组平均表现要明显优于传统的1:30教学方式。
但教育个性化程度的提升,与之相对的配套教育资源的大规模且持续地投入,且不论师资跟不上,开支也不小。
放在规模化、普适化教育环境背景下,不管短期还是长远来看都不太现实。
大模型,无疑给因材施教教育提供了一个出口。
一方面,它拓展了人力的边界。无需真人老师参与,只需将各个学科的知识图谱和数据库投喂给大模型,通过一对一对话,就能够很好地做到课外补充、辅学的作用。
未来随着3D虚拟人、VR/AR的发展,也许实现更为沉浸式、宛如真人面对面的教学场景。
另一方面,随着大模型产业链走向成熟、迭代速度越来越快。
AI学习助手将被更低成本、规模化地生成,赋能到更多地区,而且也会朝着更为细分的教育方向落地,这也进一步促进了教育的普惠。
AI正在变成因材施教、个性化教育的重要载体。
这也是整个大模型行业落地的一个缩影,现在或者不久之后,还会有更多范式改变。
— 完 —
点这里关注我,记得标星哦~