“学校的目标应当是培养有独立行动和独立思考的个人,不过他们要把为社会服务看作是自己人生的最高目标。”
——爱因斯坦
在文章的开篇,我想先把爱因斯坦这段在《论教育》中关于学校的表述写出来。这一段内容发表于1936年,正好处于西方的实用主义教育与人本主义教育观念交替的时期,很大程度上代表着当时对传统教育的批判及受教育者综合实践能力的追求。而在80多年后的今天,国内教育界站在践素质教育的探索上,同样面临着困惑。
2018世界人工智能大会刚刚在上海闭幕,通过互联网大佬们的发言记录不难看出一条信息——AI技术于所有人,都尚处于探索或战略布局阶段。
然而反观教育圈,随着教育这一“百年大计”不断在理论与政策层面递进的同时,于企业而言呈现的往往是一个又一个“风口”。截至目前,“AI+教育”正是整个2018年最火热的一个,但不乏大佬站台的AI技术,真的可以实际作用于教学吗?
这一点上我个人表示怀疑,原因如下:
2015年“大数据”概念广泛兴起的时候, 网络教育普遍面临着一种尴尬,那就是数据采集手段不健全,数据样本不够大,难以建立动态丰富的数据维度。
转眼在线教育进入“下半场”,但似乎尴尬还是那样的尴尬,只不过主人公换了个演员——缺少AI技术团队,缺少可用于训练模型的样本、难以把控数据的实际评价标准。
尴尬归尴尬,事实上随着网络技术、物联网技术的进步,原本很多的数据问题都已经得到了解决。但我关心的问题点在于,尽管一些企业能够认清自身数据服务的基本方向,并能够提供较为合理的大数据服务,但相较于宣传中的智能技术,其真正能够提供的服务也仅仅止步于此了。
教育行业的容错率真的这么高吗?
还是说,许多人所说的“AI”仅仅只是2018年大数据的别称而已。
谈到AI+教育时我们往往谈论的是满足“千人千面”的素质教育要求,那么不妨先来设定个目标:为教学场景的参与者提供策略服务。
让我们先来看看地图产品的使用场景。
当用户走在马路上忽然不确定要怎么样走到目的地的时候,打开手机地图-输入目的地-搜索,地图马上给出怎么去、几种方式、各需要多少时间、路况如何、推荐方式等等,说不定还提供了吃饭/住宿服务(手动微笑)。这样的服务是相对具有工具性特征的,但也是最具有AI策略服务的特征。
教学情景则是另一回事。
在学校场景中,由于涉及到不同的管理层级、教学环节与用户角色,单纯针对某个环节(如习题)设置AI,仍然难以对一个角色提供策略服务的支撑。
另一方面,不论是学校教学还是在线教育,引导学生阶段性的完成学习目标,构建独立的知识结构体系这一流程本身就是线性的。但在特定时间段内用户的学习成果存在不可逆性,一旦付出学习时间不能换取有效的成果,或者系统给出的策略出现了偏差,都会让用户失去对产品的信心。这一点上不少“滴滴模式”的C2C产品已经吃到了苦头。
想要完整的对学习者提供“路线图”并非不可能,但出于安全性考虑,往往这样的行为被简化成了数据推送。单纯地关注教学中的某一环,很显然是无法达到AI策略服务要求的,但这也丧失了我们一开始设想的目标。
AI在今年被抄的火热,甚至一度有人发生认为“AI+教育”能够做到实际落地,相信离不开近两年阿尔法狗的优异表现。
说实话,在柯洁落败的一年后,宣称AI能够结合落地这一点其实听起来蛮令人信服的。这样的说法是否有混淆视听的嫌疑我们暂且不论,只要简单对AI进行了解,我们就能知道,AI的学习是需要大量的样本及对抗训练来完成的。而事实上早在1997年名为“深蓝”的AI就层通过强化学习的模式战胜过国际象棋大师。
想要将AI技术应用到教育场景中,也不可避免的需要通过样本学习来建立模型。
就目前而言较为常见的大概有两种形式:
现行智慧教育产品的部署往往采用试点的形式,一所2000余人的学校往往仅有不到200人能够使用智慧教学设备进行周期性的学习。而培训机构和在线1v1的服务实际上主打的是针对性,学习人群相较学校环境具有较为明显的特征。
当一名学生进入我们的学习系统,除过对其出勤、作业正确率等等可以通过产品功能业务流程结果产生的数据进行收集外,我们其实很难从更多的维度上对这名学生进行更加全民的分析和评价,也缺少有效的手段在各个现有的维度间建立关系,尽管这和素质教育的预期是不符的。
这么看来,“刷题”似乎成为了当下唯一能够满足形成大量样本的方式,但是刷题也仅仅能够帮助企业做到自适应和数据推送,不仅始终距离为学习者提供策略建议恐怕还有非常巨大的差距。这一点我们放在稍后的算法公平环节继续讨论。
滴滴、淘宝、京东先后都爆出了大数据杀熟的问题,甚至我们看视频、看新闻也总是会“被标签”。这样的杀熟往往标志着用户在产品的数据库中所接受到的信息将会逐渐变得狭窄,最终体验到不符合自己预期的信息服务。
那么同样的问题是否会反馈在教师与学生的身上?
学习具有阶段性,教师在某一个阶段的集中备课时浏览的资源、学生在某一个知识点上犯的错误,都有可能成为系统依照知识点标签进行推荐的依据。
这个听上去似乎很棒,但有一个小问题——如何去判断使用者需要终止这种数据服务呢?
尽管用户在获取资源、完成练习的过程中会使用到知识点标签帮助自己确定内容的具体范围,但现有的自适应数据推送会忽视知识点之间可能存在的递进关系,而是仅仅根据手工标签不断地向用户推送内容。甚至即时需要判断学生是否掌握了该知识点时,同样需要通过相关知识点的习题练习进行判断。
在缺乏综合判断能力的基础上,集中式的内容推送可能会极大程度地占用用户时间并干扰实际使用体验。对于用户而言,最直观的感受就是“想要的时候没有,不想要的时候又出现了”。
每一家企业背后的终极目标是通过创造价值盈利,那么在无法满足教育舆论导向的时候,企业是否会通过现有的条件尽力创造某一种表象,来弥补自己无法达到的部分呢?
在前面的论述中我们谈到了现有的AI技术仍需要丰富信息的收集,以帮助自身建立更好的评价维度。这其中极有可能包含了很多私密的个人信息,比如:通过摄像头捕捉到的面部特征和情绪特征;比如:被录入在通讯录中的家长信息与电话号码;比如:学生可能上传的电子化日记,在线付费记录等等。
这样的信息在某种程度的封闭状态下并非不可公开,但不论教师还是学生都无法保证这些信息,是否会有教学评价以外的去处,这样想起来是很难以接受的。
我们以情绪识别为例,假设一个学生因为与同学的一些小矛盾造成了课堂上的不积极与短暂走神,在下课后或者大课间的某个时候,他就会被老师叫到办公室去聊一聊今天究竟怎么了。或者在一周后,突然被家长询问,因为相关的报表已经推送到了家长手机上。
这样的感觉糟糕透了,或许这样的假设现阶段没有发生,可一旦学生和教师认识到自己实际上处于智慧教育系统的“监控”中时,教育关系中最基本的信任就已经被打破了。这也是我们最不愿意看到的,将技术运用到了不恰当的场景中引发的灾难。
在开篇提到的西方教育理念的变革,实际上在近一百年来在不断的发生。尤其是以实用主义为开端,教育作为服务社会生产需求的第一道大门,源源不断地为社会培养、输送人才。每隔二三十年,进步的社会体系和价值观就会为教育提出新的需求,教育理论和对服务的基本诉求也会发生变化。
这样的变化对今天的智慧教育产品提出的挑战是:如何能够确保自身的大数据和AI的分析标准是有效的?
这个问题在应试教育上向来不是太大的问题,往往只是及时调整分数线就可以满足应试训练的标准。不过一旦与评价沾边,就很容易变得束手无策了。AI产品是否能够建立跨地区、跨学科、跨门类、跨阶段、能够根据实际教学变化的评价系统,往往迈不过评价标准这一门槛。
“产学研模式”常被用来打“专业牌”,但产学研往往标志着区域性的校企合作链,这中方式的合作极有可能表现为区域性的定制。
定制对企业来说是一把双刃剑,过去在业务应用层面会采用SAAS模式进行多元的功能定制,减轻企业压力。但在数据处理的评价标准上,定制往往代表着多分支的产品维护,“产学研”模式始终不能代表通行的标准。
除过技术水平限制外,我相信在AI进行教学辅助的深度学习会是一个长期持续地过程。在这个过程中必然需要不断地纠正偏差。那么,AI的设计者对待教育的态度就成为了一项很重要的标准。
教育不单单是学生享受教学服务-提交试卷-获得分数这样简单的过程,而是建立在人与人之间互相信任的基础上,共同参与情感体验并跟随人类心理发展特征探索规律的一个过程。任何一个技术团队,在脱离的教育规律的情况下,都将迅速与学习环境的实际应用脱节。
这也是为什么许多企业建立产学研链条,或培养自己的教研团队的重要原因。即便如此,一个企业以自身生存的角度出发,商业性与教育性往往处于不断角逐的关系。引进一项可以帮助企业盈利的技术非常容易,但始终保持教育规律优先的意识、不断对产品进行调整与变革是非常困难的。
“教育是人工智能最好的应用场景之一,一方面是今年的教育模式和100年前的相比还没有很明显的变化,一个教室,一群学生以及一位老师,这个产业亟需新科技升级创新。另一方面教育行业容错率高。”
——某智慧教育创始人如是说
相较于现阶段AI技术于教育领域应用的限制,上述的这一番话,才是真正引发我担忧的。说出这番话的人,有着敏锐的市场眼光和准确的场景判断,并且号称有着15年教学经验。但是一个这样的教育行业老兵,说出“教育行业容错率高”这样的观点在我看来是极为危险的。
技术应当与服务意识相结合,符合客观规律。尤其是教育这样重视经历的过程,不能简单以商业的角度去评价技术应用的意义。利用新技术打开教育公平的瓶颈、服务教学本身,提升使用者的综合能力,这才是AI+教育继续前进的方向。
不论是因为技术人才的短缺,还是处于市场目标考虑下的妥协,试图去用一项自己尚未实现的技术解决问题,都永远只会带来虚假的繁荣和新的隐患。