《数据分析》期末考试讲评

2019年1月16日下午,《数据分析》期末考试结束时,W同学来问我说,能否讲解一下最后一道题的解法,我犹豫了一下还是答应了。然而由于期末各种忙,直到今天才能够抽出时间,坐下来喝杯咖啡,在电脑前回答W同学的提问。【注:我这个学期教四门课,其中一门是158人的大课。期末考试之后不仅要改考卷、批改小组作业,还要填写各种表格,这些隐性工作量使得一个学期的结束带有某种仪式感。谢天谢地!终于在助教的帮助下用两周时间完成了这些工作。】

其实我本来并不赞成大学期间还像高中那样讲评考题,后来改变主意的原因有两个:

1、不同阶段学习的真正差异并不在于形式,而在于方法。讲评考题只是形式,在大学里未尝不可采用,关键在于怎么讲。

2、学生掌握知识的程度各不相同,不排除有些基本概念的理解和掌握仍然需要通过教师带领学生反复练习,才得以真正掌握。

《数据分析》大概属于此类课程。学会分析软件(例如UCINET)的具体操作固然重要,但是我觉得理解分析软件所处理的概念和原理,比具体操作更重要。课程期末考试也正是为了让学生深化对基本概念的理解而设计的。

根据全班答题的统计结果(见下图所示),第5题传递性和第6题结构等价两道大题的答错率最高,甚至连最基本的写出邻接矩阵和关联矩阵都有答错的,说明基本概念的理解和掌握都有需要进步的空间。在回答W同学关于最后一题的解法之前,我先简要提示一下其余各题所涉及的知识点。

《数据分析》期末考试讲评_第1张图片
期末考试的答题结果统计

1、选择题错误率最高的是递归连通图的判断,该题的答案是C,但是答错同学都是误选了B。这个选项涉及到边的对称性的理解。

2、第2题看图写邻接矩阵和关联矩阵,这没什么好说的,还是有6位同学写错,还不包括把节点字母v写成n的。这个看似完全没有技术含量的题目,还是需要一丝不苟的科学精神的。

3、第3题考核的知识点涉及非连通图邻近中心性的计算公式的含义,有三分之一同学答错。理解非连通图邻近中心性计算公式的关键点在于将可及部分节点按比例放大到整个网络,公式中就是放大系数。

4、这题考核的知识点涉及角色集和邻接矩阵的逻辑运算,大部分同学都答得很好。

5、第5题考核知识点是传递性,估计大部分同学对传递性、非传递性以及无定义(或弱传递性)的概念不是辨析得很清楚。我把三元组的传递性判断准则简要总结为以下图。

《数据分析》期末考试讲评_第2张图片
三元组传递性的判断准则
《数据分析》期末考试讲评_第3张图片
UCINET三元组统计分类

根据上述判断准则,我们可以很清楚:9,12,13,16具有传递性,6,7,8,10,11,14,15具有非传递性,1,2,3,4,5则无定义(或者中文教科书称之为“弱传递性")

6、第6题就是W同学所问的结构等价问题,这道题的数据集是欧几里得距离法测量结构等价的计算结果,跟书里完全一样,只是把阈值改变为3.40。见下图所示,分析其地位其实很简单。

《数据分析》期末考试讲评_第4张图片
Krackhardt(1990)高技术公司经理人员建议关系数据集基于欧几里得距离法所得的结构等价分层聚类

但是在考题不提供分层聚类树的情况下怎么办?其实大部分同学都找到了正确的解题思路,就是在欧几里得距离矩阵上把距离小于3.40的元素标出来。

敲黑板:这里要标出来的是小于3.40的元素,而不是大于3.40!

根据结构等价的定义,欧几里得距离越小,等价程度越高;距离等于零,则是完全等价。见下图所示。

用红圈标记出欧几里得距离小于3.40的所有元素

然后从最小的2.00开始,由小到大依次把欧几里得距离为2.00, 2.24, 2.45, 2.65, 2.83, 3.00, 3.16, 3.23 时相应的节点对查表找出来,动手列出来。同时,用不同颜色把已经列出的元素做上标记,以逐步缩小搜索范围。严格按照欧几里得距离由小到大的次序列举节点对,可以得到图中excel表格所示的结果,考试时用手工写也很简单。把符合条件的节点对都列出来,聚类结果就自然呈现了。

从2.00开始到3.32,从小到大依次把节点对列举出来
《数据分析》期末考试讲评_第5张图片
从小到大依次列举节点对的结果,由此可见在阈值为3.40时这个网络可以分为5个地位,见图中不同颜色的标记。

根据我历年来数据分析课上的观察,大部分同学往往不太重视动手练习,这是理解和掌握这门课的最大障碍。期末考试卷面上的表现也是如此,懂得用笨办法动手做标记的同学,这道题都拿到满分了。所谓“心灵手巧、心手相通”,学习《数据分析》课不也是如此吗?

感谢W同学及全体选课同学一个学期以来跟老师的交流互动,对老师来说,每次上课、每次回答提问也都是接受全新的启发和学习,谢谢你们!祝新春快乐!新年进步!

你可能感兴趣的:(《数据分析》期末考试讲评)