这个作业属于哪个课程 | 软件工程 (福州大学至诚学院 - 计算机工程系) |
---|---|
这个作业要求在哪里 | 第一次结对作业 |
这个作业的目标 | 数据采集以及数据可视化 |
作业正文 | |
其他参考文献 | pandas.DataFrame.plot( )参数详解、常用模块之matplotlib |
简单的自我介绍
-
我是来自计算机工程系计算机科学与技术的林航,学号211706186,一名渣渣
-
我的结对同伴是来自计算机工程系计算机科学与技术的洪成龙,学号211706174,一名大佬
此篇博客由我与洪成龙共同完成。
希望同学们在看这篇博客前,能先完成一下这份问卷调查
对我们的问题有一定的了解,才能刚好地理解我们为什么这么处理数据及其它思路。
关于选取的角度
此次因疫情延期开学情况下,学生在家线上学习的学习吸收率如何。
- 学习吸收率与学习态度的相关性
- 学习吸收率与学习状态的相关性
- 学习吸收率与问老师问题的频率的相关性
- 学习吸收率与其它特征的相关性
为什么选取这个角度呢
主要想了解面对这么多五花八门的在线平台,这么多纷繁复杂的授课方式,这么多天南地北的同学,究竟大家学的如何?
关于采集的数据
- 采集对象:至诚学院学生
- 数据量:110份+
- 数据采集方式:问卷调查
- 数据采集过程:把问卷调查分享自己同学们,对他们进行一次调查
- 数据处理过程:对收集到的数据使用python进行可视化分析
数据处理
从问卷系统导出编码数据
总体预览
发现有很多无用的数据和一些空值。于是进行一些简单的清洗。
students.set_index('编号', inplace=True) # 将编号设为索引列
students.sort_index(inplace=True) # 排序索引列
students.drop(['开始答题时间', '结束答题时间', '答题时长','IP归属地市',
'自定义字段','2.你的年级是?[选项填空]','3.你的专业是?[选项填空]'],axis=1,inplace=True) #删除不需要的列
students = students.fillna(0) # 用0填充所有缺失值,表示没有
students = students.applymap(lambda x: int(x) if type(x)==float else x) # 如果数据是浮点数转为整数
接下来便可以开始对数据进行处理。
数据分析
这是我们统计的比较常见的几种线上授课平台受喜爱程度,可以看出哔哩哔哩直播是同学们最为喜欢的授课平台了
这是关于课堂签到的样本数据分析
很明显可以看出对于线上学习大部分同学还是比较重视的,有七成的同学害怕睡过头而错过课堂签到,三成的同学并不害怕
友情提醒:害不害怕没关系,记得签到就好
从图中可以分析到对于线上课程,同学们还是比较认真的,大部分可以做到独立完成作业
结合前面这三张图(‘签到’,‘态度’,‘状态’),可以看出对于现在的线上教学,网络授课,大部分同学们仍处于被动状态。
因此,我们就可以要了解一下,同学们对于知识的吸收程度,看看对于网络授课同学们能不能学到东西
可以看出有一半的同学其实对于知识点的学习吸收率并不高,那我们就来分析一下学习吸收率与一些其他因素的相关性
注:以下密度图的纵坐标是人数密度,横坐标是等级,等级越高,表现越好。
可以看出学习吸收率与学习态度, 学习状态, 作业量, 帮助大小,有问题是否及时询问老师的相关性总体趋势几乎一致。
我们对于学习吸收率与学习态度独立出来进行分析
可以从中看出
注:1类态度:'只是播放并不听讲,应付老师要求,抄同学作业', 2类态度:'偶尔划划水,开个小差,独立完成课后作业', 3类态度:'认真听讲,有思考,做笔记,独立完成课后作业'
1类吸收率:'0-33%', 2类吸收率:'34%-66%', 3类吸收率:'67-100%'
1类态度同学的人数密度比1类吸收率同学的人数密度少0.05
2类态度同学的人数密度比2类吸收率同学的人数密度多0.7
3类态度同学的人数密度比3类吸收率同学的人数密度少0.26
说明2类态度(偶尔划水)的同学中有极小部分处于1类吸收率,有小部分处于3类吸收率。
我们对于学习吸收率与学习状态独立出来进行分析
注:1类状态:'迷迷糊糊,还未适应', 2类状态:'被动学习,效果一般', 3类状态:'努力学习,受益良多'
1类吸收率:'0-33%', 2类吸收率:'34%-66%', 3类吸收率:'67-100%'
1类状态同学的人数密度比1类吸收率同学的人数密度多0.16
2类状态同学的人数密度比2类吸收率同学的人数密度多0.08
3类状态同学的人数密度比3类吸收率同学的人数密度少0.35
说明3类吸收率(67%-100%)的同学有很大一部分还没调整好状态。
我们对于学习吸收率与有问题是否及时询问老师独立出来进行分析
注:1类问题:'从来不', 2类问题:'偶尔会', 3类问题:'经常会'
1类吸收率:'0-33%', 2类吸收率:'34%-66%', 3类吸收率:'67-100%'
1类问题同学的人数密度比1类吸收率同学的人数密度多0.18
2类问题同学的人数密度比2类吸收率同学的人数密度多0.66
3类问题同学的人数密度比3类吸收率同学的人数密度少0.56
说明2类问题(偶尔)同学的学习吸收率也还不错
从这些分析我们可以看出学习吸收率和学习状态最为相关,所以希望同学们调整自己的状态,自己的学习状态越好,才能吸收更多知识。
除了学习吸收率与各种因素的关联,我们其实还分析了一些其他关联
这是关于作业量与线上教学对于你的帮助
注:1类作业:'很少,十分轻松', 2类作业:'适中,可以接受', 3类作业:'很多,忙不过来'
1类帮助:'不大', 2类帮助:'一般', 3类帮助:'很大'
1类作业同学的人数比1类帮助同学的人数几乎一致
2类作业同学的人数比2类帮助同学的人数十分接近
3类作业同学的人数比3类帮助同学的人数十分接近
说明你觉得作业量有多少,你自身得到的帮助就有多少
这是关于学习状态与学习态度的关联性分析
注:1类状态:'迷迷糊糊,还未适应', 2类状态:'被动学习,效果一般', 3类状态:'努力学习,受益良多'
1类态度:'只是播放并不听讲,应付老师要求,抄同学作业', 2类态度:'偶尔划划水,开个小差,独立完成课后作业', 3类态度:'认真听讲,有思考,做笔记,独立完成课后作业'
1类态度同学的人数密度比1类状态同学的人数密度少0.2
2类态度同学的人数密度比2类状态同学的人数密度多0.66
3类态度同学的人数密度比3类状态同学的人数密度少0.1
可以看出,1类状态(迷迷糊糊)同学,虽然状态不佳,但仍坚持学习。
最后我们用了一份热力图来表示各自的关联性
注:热力图用皮尔逊相关系数来查看两者之间的关联性
这张图描述了各个特征之间的关联性。
可见,
- 吸收率与状态关联最强,上课状态好了,学习吸收率自然提高。
- 关联第二强的是态度。态度端正,但不在状态,心有余而力不足,学习吸收率也受到影响。
缺陷:
由于数据量太少,所以得出的关联不太准确。
另外有的问题出的不好,比如“你觉得作业量大吗”,这和“学习吸收率”的确实没什么关联。
在做问卷时,没考虑好重点是“学习吸收率”,所以关联性不强。
关于云结对
结对编程?不不不,面向“对象”编程!
上图为 我写编码时
上图为 我看代码时
总计一共花了两天多的时间,才终于完成数据收集及分析。
主要是使用腾讯会议进行交流,通过分享桌面,来一起探讨代码。
相对来说作图相对比较容易,但在分析关联图时,我们俩都不能很好地表达出图表所展示的内容。
吐槽
本来这次作业我是做好抱大腿的准备和这个表情包:
可惜洪成龙大佬竟然也忘记了数据分析的内容。迫于无奈我只能开始和大佬一起回忆思考。
其实关于数据分析代码还算比较好回忆(这里就体现了我和大佬的差距,当我只能想起课堂上教过的,大佬开始拓展了)
最难的是:表达图标所展示的内容,关分析关联图就占了我们大半的时间。
往往有时我们前面分析出来的结论,过不久又发现好像不对。
一直改来改去,最后得出分析出来的内容,我也不知道我们表达地对不对,如果有错,恳请提出。
总结
开个玩笑,其实根据此次疫情期间学生在家线上学习情况调查的分析,有一半同学的学习吸收率并不高,主要原因是状态和态度。
有些同学学习态度是好的,但是错误的学习状态却会导致事倍功半。想要提高学习效率,我们当前的任务就是要辨别自己的学习状态正确与否
- 有20%的同学还处于迷迷糊糊,未适应的状态。建议调整好作息,合理安排课余时间。
- 有48.2%的同学处于被动学习的状态。这类同学大多没有一个明确的学习目标,且这种学习态度会导致时间周转不过来。希望早日找到学习的目标,保持一颗热爱学习的心。
- 有31.8%的同学努力学习。很棒!继续加油!