松鼠AI智适应教育首席科学家崔炜:个性化教学,我们将颠覆传统教育

松鼠AI智适应教育首席科学家崔炜:个性化教学,我们将颠覆传统教育_第1张图片


作者 | 若名

出品 | AI科技大本营


对于智适应教育的发展方向,崔炜说,不管怎样都要从教育的痛点出发,而不只是做成教育行业里的辅助工具。


11 月 8-9 日,在 CSDN 和 AICamp 联合举办的 AI 开发者大会上,松鼠 AI · 智适应教育首席科学家崔炜讲述了他们在智适应教育技术的实践与落地,并在会后接受 AI科技大本营采访时就有关产品和业务发展情况进行解答。


崔炜演讲


很多身处乡村的学生、留守儿童得不到优质教育,其根本原因是因为老师资源的分配不均匀,很多孩子都只能接受最基础的教育,甚至很多孩子接受不到教育。一名老师教授大量学生是常见的现象,要想每个孩子都得到优质的教育,老师的数量是远远不够的。


我们过去发明的 MOOC 互联网式的教育受到了很多人欢迎,但它存在很大缺陷,一是完课率很低,二是缺乏互动性。在 MOOC 的学习过程中,主要是学生用户在系统上自主的完成学习。难以坚持下来是自主学习的主要问题,这也直接的导致了 MOOC 的完课率很低,所以学生的学习效果非常难以保证。缺乏互动性的自主学习过程没有老师的干预,学生在学习过程中碰到任何问题都没有人给他实时解答互动,这也导致了用户在使用的时候专注度低、体验感差,弃课等问题。


所以我们要打造 AI 智能个性化的学习平台,松鼠 AI 智适应学习系统是我们 AI 学习引擎的品牌。我们要让每个学生都能够拥有一对一的私人 AI 老师,帮助每个学生进行知识架构的查缺补漏,提升学习效率,从而带来学习效果的提升。我们的产品在 2017 年初上线,一年半时间里开设了 6 门课程,涉及 12 个年级,有 1600 多家学习中心,帮助了 100 多万名学生,覆盖全国 300 多个城市。


在传统的教学模式里每个学生都是被动接受老师的授课内容,不管是学霸还是学苗、无论学生的前序知识点掌握情况如何、无论学生接受新知识点速度的快慢,大家都要在相同的时间里学习相同数量的知识点。但是我们的松鼠AI·智适应学习系统能“诊断”出每个学生的学习问题,根据学生现有的知识架构,为他规划最佳的学习路径,让每个学生都能接收到量身订做的学习内容,让每个学生最大化获得学习效率的提高以及学习成绩的提升。


举个例子,不同的学生现有的知识点掌握程度不同,所以要学习的知识点数量不一样,学习的知识点顺序也不一样,不同的知识点上学习花的时间和学习内容难度也不一样。松鼠AI智适应学习系统通过先行测试来诊断学生现有知识点的掌握情况和能力水平,判断学生的知识薄弱点在哪,根据学生的薄弱点,结合算法,推送给学生目前最容易理解和学会的内容,让学生在学习的过程中过得成就感,从而激发学生的学习兴趣,保持学生在使用学习系统的时候的专注度。目前我们的产品能在不同学科上帮助学生进行有效的提升,帮助学生对学习产生兴趣,帮他在短时间内高效提升学习效率以及成绩。


智适应学习技术原理和架构


人工智能自适应(简称智适应)学习是一种教育技术,能够自动为学生提供个性化服务。从二十年代到五十年代美国有很多教育专家和计算机专家在研究如何用技术给每个孩子带来个性化的学习。大家比较常见的产品例如 Knewton 采用人工式的自适应方式构建了一套完整的学习内容,建立了学习知识架构,让每个学生进行测试,根据测试结果老师给每个学生分配不同的学习内容,把智适应的原理用到线下产品中。


松鼠AI智适应教育首席科学家崔炜:个性化教学,我们将颠覆传统教育_第2张图片


后来出现了智能教学系统。目前,智适应学习分为多种不同的类型。最简单的是建议性复习,给学生推荐他接下来要学习的内容;其次是评估层面的适应性,通过对学生进行测试,能快速检测出学生的能力水平和对知识的掌握程度;最后是高度的智适应,能做到根据实时、动态的学生情况对学习路径进行调整。


智适应学习不需要老师的干预,其背后的技术实现原理可以基于很多方式,一种是基于个性化偏好,老师通过观察和对学生的了解来判断学生个人偏好,给他匹配不同的学习内容。一种是基于规则的学习系统预先编程,有 if...then 的逻辑闭环。还有一种是算法排序的学习系统来动态的计算内容顺序,基于算法驱动的学习系统能够更好的满足个性化需求。

      松鼠AI智适应教育首席科学家崔炜:个性化教学,我们将颠覆传统教育_第3张图片


基于算法驱动的智适应测试驱动系统基于自动化测试排序,通过一个测试把学生分为几种类别。AI 能力驱动的系统广泛地观察某人试图学习的内容,从广泛的内容中提取出相关内容,来评估学生知识掌握的程度和能力水平,看学生是否能到达他现阶段应该在的能力水平上。如果能力水平不达标,系统会让他停留在最薄弱的知识点上继续学习、层层递进;如果能力达标,系统会推送拓展题,帮助学生进一步提高。


只有全面评估学生所学内容的掌握情况,才能更加清楚了解学生整体知识情况,从而对症下药。根据学生测试情况找到学生真正的错因,设定个性化学习路径,匹配不同学习内容,实现千人千面的个性化教学。


我们的智适应系统的目标是做到精准诊断、高效学习。精准诊断由两个部分组成,一个是学生开始学习前诊断出学生的知识漏洞,一个是在学生学习过程中不断发现知识漏洞以及随着学生能力水平的变化而补全的知识漏洞。而高效学习是指系统在精准诊断的基础上自动生成的动态个性化学习路径和最适合学生的学习内容。


松鼠AI智适应教育首席科学家崔炜:个性化教学,我们将颠覆传统教育_第4张图片


基于这些特征我们在系统里有四个模型:第一是学生的模型,来评估学生在每个时刻的学习情况、对知识点掌握的情况、学习的效率和学习的能力;第二是内容模型,我们清楚了解到内容哪一块对哪类学生有帮助;第三是教学模型,这个学生是需要哪种教学方式,我们需要根据学生不同的学习风格匹配合适的教学方式;第四是预测模型,我们会基于学生当前的学习情况给学生做预测,预测学生接下来学习下一个知识点之后会达到什么样的水平,预测学生将会花费多长时间才能完成下一个学习目标,这四个模型是相互关联的,把四个模型相互结合才能打造更加个性化的学习产品。


学习目标的合理性是一个重要的教育理念,在过去的教育模式里老师和家长希望每个孩子都考 100 分,但每个学生达到这个目标所需要花费的时间、精力是不一样的,所以教育理念是应该给不同的学生设立不同的学习目标,让每个学生在学习过程中获得自我成就感。


诊断的准确性和效率就像去医院看病一样,诊断的准确率和效率越高,患者的康复概率越大、周期越短。我们对学生的判断越准确,学生的学习效率就会越高。然后是学习内容的质量,内容不会让系统自动产生,内容一定是人为完成,不同的学生有不同的学习习惯和喜欢的学习内容类型,我们能实时采集到学生的内容反馈,用大数据分析了解到试题的区分度,对后面的学生做到更精准匹配。


最后是干预和辅导的时机、效果和效率,在整个产品形态里机器是完成教学的主要手段,以学生为中心,老师与学生跟系统相结合,是人机共教的模式。智适应系统很重要的一点是能够提醒老师这个学生什么时候需要辅导,实现以学生为中心的教学模式。


打造以学生为中心的智适应学习系统


智适应系统在产品的设计过程里会结合不同的教育心理学理念和教学理论知识给学生带来更好的学习体验,从而提升学生学习的主动性,让学生愿意花更多时间学习,培养学生更好的学习习惯,这是我们产品考虑的关键因素之一。

       

松鼠AI智适应教育首席科学家崔炜:个性化教学,我们将颠覆传统教育_第5张图片


这个产品是以学生为中心的,每个学生都能按照自己的节奏学习,并且是基于能力的学习,我们会及时评估,系统不会因为学生知识点没有掌握停下来或者跳过,而是会采取战略优先的方法让他学会更加有利于其掌握的知识点,在学生能力提升之后再进行该知识点的学习,确保掌握后,然后再进行下一个知识点的学习。不同学生的大脑结构不一样,认知规律也不一样,一堂课讲下来后学生的学习效果和收获也不一样,系统会分析出每个学生的规律然后给他匹配合适的内容。精熟学习,学生要达到相应的能力水平才能进行更难的知识点学习。


智适应产品目标非常多,教育是长期投资,最后看带来的效果和收益,效果和收益不是立马能见效的,我们针对产品打造和 AI 技术的落地考虑了很多方面的因素,比如学习必须要有内容推荐,还要有相对应的命题帮助学生把知识点掌握得更加熟练。必须要有这样一套内容管理的系统,记录每个学生在系统上产生的学习数据和行为数据,根据这些数据对每个学生进行个人画像。所有这些系统有一个中枢系统(Master Data Service)做系统之间的衔接,打造系统的过程中我们要构建系统架构的目标蓝图。


我们 AI 技术主要目的是用在这些方面:第一做知识诊断;我们希望打造一个超级 AI 老师,能够在没有真人老师干预的情况下智能化的给每个学生提供性化的辅导。第二要做到高效治疗;松鼠 AI 系统中初中一个学科我们拆分到了 3 万多个超纳米级的知识点,知识结构非常复杂。每个人的知识储量是不一样的,想要精准的判断出学生的知识结构是非常困难的。而教学大纲里只是粗颗粒度的,很难做到精准判断学生的现有知识点掌握情况,但是我们的纳米级拆分将知识点拆分得非常细,3 万多个知识点要评判出每个学生到底有哪些会哪些不会,这是很有挑战的事情,但这能精准的测量出学生知识架构。


大部分的老师对学生的情况不是很了解,所以我们希望精准判断出每个学生对知识的掌握情况。最关键的是我们构建了一个知识体系,形成了一个知识状态。先行测试的目的从理论上来讲,是在庞大的知识空间里寻找到学生对应的知识状态。


如何做到动态实时规划学习路径?


然后是给学生生成实时动态的学习路径。我们的系统会给学生制定只属于他的学习路。,可以给学生规划他的学习顺序。我们能做到战略放弃和战略优先,让学生将有限的时间放在最应该学习的知识点上。


例如某个考试需要学生要掌握 1 千个知识点,但在持续学习中发现学生学习能力非常弱,我们能够预测他在未来 1 千个时间点上花的时间超过他能学习的时间, 1 个月后马上要参加考试,不可能在一个月时间内把 1 千个知识点全学会,所以需要算法做到优先训练当前有能力能学好的知识点,让学生集中时间花在他能够快速学好的知识点上面,对于学霸可以让他放弃已经学会的知识点,集中注意力于不会的知识点上,甚至可以超前学习。这需要做到以下四点:


内容匹配:依据学生学习能力匹配难度合适的学习内容,让学生体验到事半功倍的效果。不同的学生在不同的知识点上分配的时间是不一样的,我们能够给学生分配不同学习时间,目的是让他在有限的时间内达到最优的学习目标。


知识的表征:教育领域需要用这样一个技术把机器的结构表征出来,学科里有很多专业词汇和公式,很难做到机器识别,我们构建了完整的知识体系结构,用机器去识别每个学生的知识结构,因为机器不能识别视频具体对应的是哪一个知识点,所以我们要求对知识点进行纳米级拆分,只有这样机器才能做到更加的精准。


构建知识图谱:学科领域的知识图谱区别于搜索里面的知识图谱,在学习过程中基础知识学不好,没办法学习后面的知识点。如何评估学生的知识状态?持续性、实时性、传递性,这需要评估每个学生的知识水平,我们会收集每个学生做题的时间、题目考查的知识点和难易程度,这些都是我们构建学生画像的重要因素。系统会实时的进行用户分析,生成学生画像,产生学习报告。


评估最后的教学效果:教育产品很重要的一点是能给给学生带来怎样的学习效果,所以教育产品形成良好的口碑是最重要的。目前我们进行了四场人机大战对比实验,采取随机分组的形式把学生分成对照组和实验组,实验组是根据系统自动进行学习没有老师干预,对照组是一个老师带 15 到 20 个学生,在学习之前进行前测,学习之后进行后测,后测是第三方出卷保证难度是一致的。对比实验的结果已发表在学术会议上。


我们在持续不断的进行努力,希望把更多、更好、更先进的技术应用在智适应学习产品里,希望为教育贡献我们的力量,为乡村的孩子带来更高质量的教育和个性化的教育。


以下为 AI科技大本营对崔炜的采访内容:


AI科技大本营:有业内人士说目前 AI+教育的整个行业状况是还处在搬数据的阶段,您看到的又是怎样一番景象?


崔炜:目前我们整个行业看得到的是 AI 已经像李开复说的到了收获期,这指的是相对于过去很多年来说,AI 现在已经进入到一个成熟的应用期,过去很多 AI 是停留在理论层面的,所以说现在其实是一个最好的时代,就是能够应用 AI 的最好的机会。


当然,任何一个产品的发展过程肯定会经历一个初期、中期一直到一个非常完善、体验非常好的产品。我们现在可以说是还不够非常完善,但这是一个很好的起点。


AI科技大本营:今年在产品上有没有必须要达到的一些目标?


崔炜:我们目前是在进一步去扩展更多的学科、更多的应用,从而带来更多丰富的内容。技术是一方面,跟技术相匹配的另一方面是内容,就像今日头条一样,它能够带来千人千面的个性化体验,这也是因为它的内容积累得足够丰富。扩展更多学科在商业模式上能节省成本,因为同一个用户可以报一门学科,也可以顺便报其他学科。


我们也在不断去加强我们的技术壁垒。像我们跟世界上最顶尖的几家机构都有合作,包括斯坦福大学、中科院、卡内基梅隆大学都建立了相应的联合实验室或者研发中心,共同来研发我们的产品,同时在国际学术期刊上我们也发表了相应学术论文。


AI科技大本营:技术更新周期是怎样的?


崔炜:大的迭代两三个月就有一次,小的叠加每周都在进行,我们是互联网运营模式,也就是小步快跑。


AI科技大本营:你们如何解决 C 端教育产品的流量和获客问题?


崔炜:我们综合了线上+线下相结合的模式。线上类似于 VIPKID、VIPABC 有线上远程的教学业务来获取流量。线下是像盒马鲜生这样的体验店,我们主要在非一线城市做了学习中心,调研后发现其实线下至少有 60% 的流量。


区别于传统的培训机构,我们的学习中心高科技氛围营造了一种宽松愉悦的气氛,并且我们实行的是不超过 10 名学生的小班形式,但对每个学生来说获得的却是一对一的个性化辅导,因为我们的产品是一个以学生为中心的自主学习系统。所以在小班课上的老师是不教学的,老师只是跟随着学生的教学,只在需要的时候帮助学生。


AI科技大本营:你们几乎包揽了从技术平台、内容到线下招生的所有环节,最开始做智适应学习的 Knewton 也是这种打法,但最后只剩提供算法 API 了,所以并没有形成一个比较好的商业模式,你们会有这种担忧吗?


崔炜:没有担忧。做这样一个业务模式以及背后的技术架构,我们都经过了深度思考。从 2014 年我们开始做产品到 2017 年初上线,在这近四年时间里,我们做了很深入的研究,包括竞品的商业模式、产品形态、技术落地等重要问题,也就是在思考如何避免从国外引进的模式在中国碰到水土不服的问题。


AI科技大本营:您说最终要打造一个 AI 教育的 iOS 生态系统,能不能具体描述一下?


崔炜:内容、引擎系统、运营、市场等全部都做其实就是一个 iOS 闭环系统,它跟安卓不一样,像 Knewton 的引擎系统其实做的就像一个安卓,相当于只做一个发动机,但我们是做“整车”的这样一个 iOS 闭环系统,整个系统包括生态链、生态体、生态系统、生态结构等好几个模块,这里面也包括 Learning Management System(学习管理系统),它是直接跟用户进行交互,而内容管理系统,主要目的是管理课程、管理知识、管理内容资源等。


其次是智适应学习的引擎,这个引擎是与我们大数据分析平台挂钩,同时我们另外一个系统 Learning Recording System(学生学习的数据管理平台)是学习的记录系统,收集了所有学生学习的数据和行为数据,这是 AI 引擎的一个重要基础。


还有一个中枢是 Master Data Service,这是一个主数据服务系统。同时还有 CRM 系统,这是管理老师、校长等管理员的系统,但其实也是一个课程售卖的系统,背后服务主体是家长。围绕 Master Data Service 把这些不同部分进行关联,从而能统一进行对接管理。这里每一个系统都可以独立出去做一个独立的公司,但我们形成了一个完整的闭环。


这样做的缺点很明显,做的事情很多会很累。外面说做这个系统很简单,没有深度学习处理、自然语言处理那么复杂,每一个点都是一个独立系统,但它整个合起来是一个蛮复杂的大工程。


AI科技大本营:这样一个非常复杂的系统由刚成立三四年的创业公司来做不会太容易。


崔炜:是的,松鼠 AI 系统研发的近四年里,借鉴了国际上很多顶尖的技术和经验。即便如此,现在很多东西不是那么容易去做。国内有很多公司也都在做,但可能做一、两年也很难出来。


目前国内宣称自己上智适应教育有 50 多家公司,很多的本质上还是以老师为中心的教学模式,目前国内整体的智适应技术应用还处在一个初中级的程度,我们松鼠 AI 智适应教学系统是完全取代老师来完成教学过程,实现以学生为主的千人千面的教学模式。不管怎样,我们都要从教育的痛点出发,而不只是做成教育行业里的辅助工具。


【完】


公开课预告

文本分类


文本分类问题是企业在NLP领域中处理文本数据时经常会遇到的一个问题,很多时候,我们需要将文本信息进行分类,或提相关的接口以供外部进行文本上传,在针对于用户所上传的文档信息就需要进行文档内容的分类,那么针对于这个需求我们就需要使用到文本分类的相关模型和算法进行处理。在文本分类领域中的模型和算法有很多。


本次演讲就是从这个角度入手,通过对比来阐述不同的算法、模型在实际的应用过程中的区别,以及在文本分类实践中所遇到的各种坑。


主题:精讲文本分类在企业中的应用实践

时间:12月13日20:00-21:00

讲师:黄鸿波


640?wx_fmt=jpeg


推荐阅读

老码农冒死揭开行业黑幕:如何编写无法维护的代码

通证简史|从日进斗金到夹缝求存, 细数Token的前世今生

想让马云成为你的老大?揭秘阿里面试情景

用 Python 分析了 10000 场吃鸡数据,原来吃鸡要这么玩!

名企程序员被裁实录:早上还在改 Bug,晚上就成下岗工

你可能感兴趣的:(松鼠AI智适应教育首席科学家崔炜:个性化教学,我们将颠覆传统教育)