【2023华中杯】B题 小学教学应用题 相似性度量及难度评估 29页论文及MATLAB代码

【2023华中杯】B题 小学教学应用题 相似性度量及难度评估 29页论文及MATLAB代码_第1张图片

1 题目

B 题 小学数学应用题相似性度量及难度评估

某 MOOC 在线教育平台希望能够进行个性化教学,实现用户自主学习。在用户学习时,系统从题库中随机抽取若干道与例题同步的随堂测试题,记录、分析学生的学习和答题信息,并且课后会自动生成作业题(或练习题)。此外,系统还能够定期回溯学生的易错题所涉及的内容,自动推荐题型相似、难度有层次的其他题目供用户进行拓展练习。为实现这样的功能,如何度量题目之间的相似性,如何评估题目的难度,是该产品要解决的关键问题。以小学数学应用题 1 为例,度量题目之间相似性的依据主要有以下两种:

  1. 题干文字。这种方法一般只能找到与题干文字相近的题目作为相似题目。但是,有些题目的题干文字相似,而关键字词不同,题意差异较大;有些问题的背景可能毫无关联,题干文字也几乎不同,而题目的解题思路与方法技巧却完全相同。因此,这种方法效果有限。
  2. 事先标注题目的知识点等信息。这种方法的推荐效果取决于知识点的划分方式和粒度。知识点划分太粗,推荐结果可能与例题或用户的易错题差别太大;知识点划分太细, 推荐结果可能太单一。两种情况下都无法真正达到拓展练习的目的。

评估题目难度的常见做法主要有以下两种:

  1. 根据考试的类型确定。比如,数学竞赛的试题一般比某个小学期末考试题目难。

  2. 教师根据经验主观判断。

上述判断题目相似性和评估难度的做法都有明显的局限性。该公司聘请你们团队尝试解决这些问题。以小学数学应用题为例,具体任务如下:

  1. 设计刻画两道小学数学应用题之间相似性的度量方法。

  2. 建立评估小学数学应用题难度的数学模型。

  3. 附件1是一个示例题库,包含 100 道应用题。请将附件1中的题目,按相似性或难度分类(不限制某一道题目只能属于一个分类)。如果某道题目没有相似题目,可以单独成一类。评估算法的复杂度,能否适用于更大规模的题库。

  4. 附件2中包含10道题目,请使用上述模型或方法分析这些题目的难度,并对于其中的 每一道题目,在附件 1 中找出最相似的一道或若干道题目(没有相似题目可写“无)”。评估算法的复杂度,能否适用于更大规模的题库。

注 1:题目所述小学数学应用题,是指以四则运算为主要求解方法,有一定实际背景的问题。
注 2:教学中还有一种确定题目难度的常见做法,即根据题目的实际得分率来定义题目的难度。但是,题目的实际得分率不仅与学生考前的学习情况有关,还与很多“非技术”因素有关,比如题目所用的词语、句型、语态,甚至是题目在试卷中出现的先后顺序等等;实际的得分率也只能通过采集真实的试卷信息获得,工作量大。因此,本题所关心的是题目的“技术”难度,不考虑实际的得分率。附件说明:

  1. 附件 1 为 CSV 格式文件,无标题行,共 2 列 100 行。第一列为题目编号,形如“P001”、“P002”等。第二列为题目内容。

  2. 附件 2 为 CSV 格式文件,无标题行,共 2 列 10 行。第一列为题目编号,形如“Q001”、“Q002”等。第二列为题目内容。

附件2.csv部分内容,

P001 将一批糖果分给幼儿园大班小朋友,如果每人分3颗,就余下21颗;如果每人分4颗,就余下6颗。幼儿园大班有小朋友多少人?这批糖果共有几粒?
P002 姐妹俩从家出发去上学,姐姐每分钟走50米,妹妹每分钟走45米。如果妹妹比姐姐早走5分钟,那么姐妹俩可同时到达学校。问:家到学校有多远?
P003 钢铁厂用两辆运输车从距工厂90千米的矿山运矿石回来。现有甲、乙两辆运输车,甲车自矿山、乙车自钢铁厂同时出发,相向而行,速度分别为每小时40千米和50千米,到达目的地后立即返回,如此反复进行多次。如果不计装卸时间,且两车不作任何停留,则两车在第三次相遇时,距矿山多少千米?

附件2.csv部分内容,

Q001 一列客车长150米,每秒行30米;一列货车长200米,每秒行20米。两车相向而行。当错车而过时,客车司机多久可以看到货车通过?货车司机多久能看到客车通过?
Q002 一批旅客决定分乘几辆大巴车,要使每辆车乘坐同样的人数。起先,每辆车坐22人,发现有一人坐不上车;若是开走一辆空车,那么所有的旅客刚好平均分乘余下的车。已知每辆车的容量不多于32人,问原有多少辆汽车?这些旅客有多少人?

2 论文介绍

大数据背景之下,新课改不断深化,小学数学应用题难度逐步加强,某 MOOC 教育平台为了实现教育领域的“个性化”,无论是自由组题的个性化,还是试题推荐的个性化,都 首先需要确定试题是否与学生能够相似匹配及题目难易度是否得当。为解决大数据分析下度 量题目相似性以及评估题目难易程度,我们通过建立余弦相似度模型、TF-IDF 模型 K-均值聚类模型并设计对应求解算法对待解决问题中小学数学应用题相似性和难度评估进行全面 而深入的数据处理与模型优化分析研究。

**针对问题一:**对于小学数学题求解过程相似性的度量分析问题,基于相似度的运算,通 过引入余弦相似度对题目参量指标进行相似性分析,并编写程序进行计算,最后将实例与偏 相关系数方法对比效果验证本文方法的有效性和准确性。

**针对问题二:**在问题一的基础上,建立特征向量转化为特征矩阵来判断分析其题目的难 易程度,并给出近似值矩阵,进而构建多元回归模型,针对小学数学应用题难易的相似性分 析及难易程度的评估。

**针对问题三:**通过问题一与问题二所给模型对附件 1 中 100 道小学数学应用题按其相似度及难易程度进行初步分类,通过对分类情况的具体分析,进而优化和建立新的模型,从 而提高分类的准确性,并设计算法编写代码进行分类,最终对算法进行复杂度评估。

**针对问题四:**建立在问题一构建的余弦相似度模型基础上,增加了对文本内容的分析, 利用 python 等数据挖掘软件对文本内容进行转换,计算转换后向量的余弦相似度大小,匹配出相似度最高的题目,并对算法进行复杂度评估。对模型及算法进行进一步优化,并向多个不同领域进行推广。

关键词:相似性度量,余弦相似度,多元回归,聚类分析

3 下载

查看知乎文章的底部,或者私我

你可能感兴趣的:(数学建模入门到精通,matlab,华中杯,B题,小学教学应用题,相似性度量与难度评估)