这个作业属于哪个课程 | 软件工程 (福州大学至诚学院 - 计算机工程系) |
---|---|
这个作业要求在哪里 | 第一次结对作业 |
这个作业的目标 | 数据采集以及数据可视化 |
作业正文 | 见下文 |
学号 | 洪成龙211706174、林航211706186 |
其他参考文献 | pandas.DataFrame.plot( )参数详解、常用模块之matplotlib |
简单的自我介绍
- 我是来自计算机工程系计算机科学与技术的洪成龙,学号211706174,喜欢篮球,动漫。
- 我的结对同伴是来自计算机工程系计算机科学与技术的林航,学号211706186,是我在大学里认识的第一个朋友。
此篇博客由我与林航共同完成。
希望同学们在看这篇博客前,能先完成一下这份问卷调查,
对我们的问题有一定的了解,才能更好地理解我们为什么这么处理数据及其它思路。
代码没有完全发出来,大家有什么不懂的地方,也可以私聊我们。
关于选取的角度
此次因疫情延期开学情况下,学生在家线上学习的学习吸收率如何。
- 学习吸收率与学习态度的相关性
- 学习吸收率与学习状态的相关性
- 学习吸收率与问老师问题的频率的相关性
- 学习吸收率与其它特征的相关性
关于采集的数据
- 采集对象:在校大学生
- 数据量:110份+
- 数据采集方式:问卷调查
- 数据采集过程:把问卷调查分享自己同学们,对他们进行一次调查
- 数据处理过程:对收集到的数据使用python进行可视化分析
数据处理
从问卷系统导出编码数据
总体预览
students.set_index('编号', inplace=True) # 将编号设为索引列
students.sort_index(inplace=True) # 排序索引列
students.drop(['开始答题时间', '结束答题时间', '答题时长','IP归属地市',
'自定义字段','2.你的年级是?[选项填空]','3.你的专业是?[选项填空]'],axis=1,inplace=True) #删除不需要的列
students = students.fillna(0) # 用0填充所有缺失值,表示没有
students = students.applymap(lambda x: int(x) if type(x)==float else x) # 如果数据是浮点数转为整数
数据分析
> 从以上三幅图可以看出本次采集的数据样本大部分为17计科的男同学这是我们统计的目前在使用的几种线上授课平台受喜爱程度,可以看出B站直播是同学们最为喜欢的授课平台
从图中可以分析到对于线上课程,同学们还是都有在学习的,只有极少数同学并不认真。
结合前面这两张图(‘态度’,‘状态’),可以看出对于现在的线上教学,大部分同学们仍处于被动状态。
因此,我们就可以要了解一下,同学们对于知识的吸收程度,看看对于网络授课同学们能不能学到东西
可以看出有一半的同学其实对于知识点的学习吸收并不理想。
那我们就来分析一下学习吸收率与一些其他因素的相关性
注:1-3数值增加 表示 学习吸收率增加,态度增加,状态增加,笔记增加,自我感觉作业量增加,得到网课的帮助增加,问老师问题的频率增加。
根据表格可以观察出,笔记这列比较反常,所以不考虑这个特征。
注:以下密度图的纵坐标是人数密度,横坐标是等级,等级越高,表现越好。
可以看出学习吸收率与学习态度, 学习状态, 作业量, 帮助大小,有问题是否及时询问老师的相关性总体趋势几乎一致。
对于学习吸收率与学习态度的独立分析
注:1类吸收率:'0-33%', 2类吸收率:'34%-66%', 3类吸收率:'67-100%'
1类态度:'只是播放并不听讲,应付老师要求,抄同学作业',
2类态度:'偶尔划划水,开个小差,独立完成课后作业',
3类态度:'认真听讲,有思考,做笔记,独立完成课后作业'
可以看出
1类态度同学的人数密度比1类吸收率同学的人数密度少0.05
2类态度同学的人数密度比2类吸收率同学的人数密度多0.7
3类态度同学的人数密度比3类吸收率同学的人数密度少0.26
说明2类态度(偶尔划水)的同学中有极小部分处于1类吸收率,有小部分处于3类吸收率。
对于学习吸收率与学习状态的独立分析
注:1类吸收率:'0-33%', 2类吸收率:'34%-66%', 3类吸收率:'67-100%'
1类状态:'迷迷糊糊,还未适应', 2类状态:'被动学习,效果一般', 3类状态:'努力学习,受益良多'
1类状态同学的人数密度比1类吸收率同学的人数密度多0.16
2类状态同学的人数密度比2类吸收率同学的人数密度多0.08
3类状态同学的人数密度比3类吸收率同学的人数密度少0.35
说明3类吸收率(67%-100%)的同学有很大一部分还没调整好状态。
对于学习吸收率与有问题是否及时询问老师的独立分析
注:1类问题:'从来不', 2类问题:'偶尔会', 3类问题:'经常会'
1类吸收率:'0-33%', 2类吸收率:'34%-66%', 3类吸收率:'67-100%'
1类问题同学的人数密度比1类吸收率同学的人数密度多0.18
2类问题同学的人数密度比2类吸收率同学的人数密度多0.66
3类问题同学的人数密度比3类吸收率同学的人数密度少0.56
说明2类问题(偶尔)同学的学习吸收率也还不错。
从这些分析我们可以看出学习吸收率和学习状态最为相关,所以希望同学们调整自己的状态,自己的学习状态越好,才能更好地吸收知识,提高学习效率。
除了学习吸收率与各种因素的关联,我们其实还分析了一些其他关联
关于作业量与线上教学对于你的帮助
注:1类作业:'很少,十分轻松', 2类作业:'适中,可以接受', 3类作业:'很多,忙不过来'
1类帮助:'不大', 2类帮助:'一般', 3类帮助:'很大'
1类作业同学的人数比1类帮助同学的人数几乎一致
2类作业同学的人数比2类帮助同学的人数十分接近
3类作业同学的人数比3类帮助同学的人数十分接近
说明你认为的作业量越多,你所得到的帮助就越大,提升就越多。
关于学习状态与学习态度的关联性分析
注:1类状态:'迷迷糊糊,还未适应', 2类状态:'被动学习,效果一般', 3类状态:'努力学习,受益良多'
1类态度:'只是播放并不听讲,应付老师要求,抄同学作业',
2类态度:'偶尔划划水,开个小差,独立完成课后作业',
3类态度:'认真听讲,有思考,做笔记,独立完成课后作业'
1类态度同学的人数密度比1类状态同学的人数密度少0.2
2类态度同学的人数密度比2类状态同学的人数密度多0.66
3类态度同学的人数密度比3类状态同学的人数密度少0.1
可以看出,1类状态(迷迷糊糊)同学,虽然状态不佳,但仍坚持学习。
最后我们用了一份热力图来表示各个特征的关联性
注:热力图用皮尔逊相关系数来查看两者之间的关联性
这张图描述了各个特征之间的关联性。
可见,
- 吸收率与状态关联最强,上课状态好了,学习吸收率自然提高。
- 关联第二强的是态度。态度端正,但不在状态,心有余而力不足,学习吸收率也受到影响。
缺点:
- 由于数据量太少,所以得出的关联不太准确。
- 在做问卷时,没考虑好重点是“学习吸收率”,所以关联性不强。
- 有的问题出的不好,比如“你觉得作业量大吗”,这和“学习吸收率”的确没什么关联。
关于云结对
结对编程?不不不,面向对象编程!
上图为 我看林航编码
上图为 林航看我编码
我们俩一共花了两天多的时间,才终于完成数据收集、可视化及分析。
我们主要是使用腾讯会议进行交流,我分享桌面,并一起探讨代码。
作图相对比较容易,但在分析关联图时,我们俩都不能很好地表达出图表所展示的内容。
吐槽
-
数据分析的内容都忘记了,一开始竟然无从入手。后来慢慢地,感觉来了,也就上手了。
-
我觉得最难的是,表达图标所展示的内容,分析关联图就占了我大半的时间,本以为已经准确描述。
后来我自信满满地把做出来的图表分析给我姐姐听,但我姐姐提出的几个问题把我整懵了,于是又重新分析。
但是最后分析出来的内容,我也不知道我表达地对不对,如果有错,恳请提出。 -
关于与林航的合作,还算愉快。
他的不足之处在于,一个很简单的问题,他常常讲一堆话来解释,还停不下来,我都听不懂他在讲啥。
而我,语言表达能力极差,不能清楚地表达出我分析的结果。 -
我在出问卷的时候,没抓好重点,导致做数据分析时磕磕碰碰。
改进
- 在部分密度图上加了一条黑线
- 在密度图旁边加上了相对应的表格,方便理解
- 将不那么准确的词语如“一些”、“一半”等改成数值
- 加了小提琴图,从吴秋悦大佬那学习到的新知识
总结
根据此次疫情期间学生在家线上学习情况调查的分析,有一半同学的学习吸收率并不高,主要原因是状态和态度。
有些同学学习态度是好的,但是错误的学习状态却会导致事倍功半。想要提高学习效率,我们当前的任务就是要辨别自己的学习状态正确与否。若不足,则改进。
- 有20%的同学还处于迷迷糊糊,未适应的状态。建议调整好作息,合理安排课余时间。
- 有48.2%的同学处于被动学习的状态。这类同学大多没有一个明确的学习目标,且这种学习态度会导致时间周转不过来。希望早日找到学习的目标,保持一颗热爱学习的心。
- 有31.8%的同学努力学习。很棒!继续加油!