MOOC教育大数据研究现状调研

研究团队

目前没有看到有专门的团队专攻MOOC大数据的研究,仅有一些文章发表,并且发表这些文章的人都来自全球顶尖的高校,如:国外MIT;国内清华、北大都有相关的文章发表。可能是因为这些高校都在知名MOOC网站上开设了一些课程,能取到许多相关的数据。

国际会议

国内对MOOC的研究比较重视,举办了一次专门针对MOOC教育的国际会议

典型论文介绍

1、 Likely to stop? Predicting Stopout in Massive Open Online Courses

这是MIT的一个硕士研究生写的论文。文章分析了Coursera 上2012年秋季《电子电路》课程中注册的所有学生在线行为数据,并根据学生的行为数据来对学生是否会提前退出以及何时退出进行预测。主要采用的预测模型是logistics。知道了预测结果之后,有利于采用一些干预方法使得学生退出率降低。这篇文章值得借鉴的地方如下:

  • 退出时间点的定义:根据学生提交作业时间(若学生在第三周提交了作业,第四周没有提交作业,则学生是在第四周退出)
  • 将学生分类,根据学生类型来进行预测:学生分为四类,即:仅听课,不参与论坛及wiki维护、听课,仅参与论坛互动、听课,仅参与wiki维护、听课、参与论坛互动及wiki维护
  • 从数据中抽取了27个特征
  • 采用了混淆矩阵及热力图的方式来展示预测准确度

可能存在的问题:总的退出率是96%,也就是说随便从100个人中抽取出一个出来,猜他退出的准确率高达96%。文中预测的准确率不高,在70%左右(文中的要求更严格一些,是猜学生在第几周退出)

2、 What decides the dropout in MOOCs?

这是北大的一篇文章。题目看起来像是要分析出是什么原因导致了MOOC课程中的高退出率,但实际上分析的内容与MIT的论文类似,也是预测学生在接下来几周中是否会退出MOOC课程。但该文章与MIT的文章区别及创新在于以下几点:

  • 采用了不同的预测模型,如:滑动窗口、SVM;
  • 选取的特征不同(19个),部分特征的选取进行了详细的分析;
  • 分析了多门MOOC课程,并对不同课程的学习情况进行了比较;

总的来说,根据用户在线的行为数据来研究MOOC课程中为什么有那么多人退出的难度较大。退出只有一个结果,但退出的原因较多,例如:听不懂,网络不好,有其它事情要做等等。

你可能感兴趣的:(其它)