寻找失散多年的兄弟——利用知识点标注数据来推荐相似题

 

文章均从个人微信公众号“ AI牛逼顿”转载,文末扫码,欢迎关注!


八月份的尾巴,是“秋老虎”~~眼瞅着就要夺取抗“日”的伟大胜利了,这才擦了擦汗,更新一篇关于试题相似性分析的原创帖。这里先感谢同事Miss杨提供的标注数据,否则也是巧妇难为无米之炊呀。

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第1张图片

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第2张图片

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第3张图片 https://blog.csdn.net/weixin_43917778/article/details/100140848

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第4张图片

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第5张图片

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第6张图片

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第7张图片

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第8张图片 所有试题最多只标注5个知识点,试题重点考察的知识点优先标注

 

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第9张图片

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第10张图片

 

随机抽查了50道原题,其中有一题的知识点标注有误,不予考虑。每道原题给出5道最相似的推荐题,统计结果如下图。左边纵轴表示推荐题的数量;右边纵轴表示相似率;横轴表示原题里标注的知识点个数。

 

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第11张图片

 

抽检样本数量有限,图线变化的规律有待深入探索。但是只包含单个知识点的试题,其推荐效果较差,在实验题里表现得尤为突出。很大原因在于知识体系里,实验部分的知识点分类比较笼统。

其他的发现还有待进一步挖掘,这里就不再叙述。另外要指出的是,标注知识点本身就有很大的主观性;其次,分析两道试题是否相似,也是妥妥滴主观判断。所以在不同人眼中,结果有些差异在所难免。毕竟,所有的客观都是主观,所有的意见都是偏见。

 

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第12张图片

 

后记:文中涉及的真实数据具有保密性,所以不上传。文末给出的代码链接里,会附上和真实数据表有相同格式的测试数据,内容肯定是瞎编啦。只用于代码的运行。

寻找失散多年的兄弟——利用知识点标注数据来推荐相似题_第13张图片

千里之行始于足下!定期分享人工智能的干货,通俗展现原理和案例实现,并探索案例在中学物理教育过程中的使用。还有各种有趣的物理科普哟。坚持原创分享!坚持理解并吸收后的转发分享!欢迎大家的关注与交流。

下载链接:https://download.csdn.net/download/weixin_43917778/11637617

你可能感兴趣的:(NLP,文本相似性分析)