【媒体大数据挖掘实战】网络分析入门篇

2700字,12分钟

一、传播网络的基本概念

二、网络的拓扑结构

     规则网络网络

    随机网络模型

    复杂网络模型

三、网络的分析指标

    节点度分布

    聚类系数

    平均最短路径和网络直径

    网络密度

    节点中心性

四、社会网络分析相关理论

    强关系与弱关系

    嵌入性

    结构洞

    社会资本


一、传播网络的基本概念

传播网络是深深嵌入在社会网络中影响我们信息相互沟通的网络。

探究社会规律的成因不取决于个体的想法或意图,而应该从个体所嵌入社会结构中去发现规律。

研究对象:节点(行动者)、节点与节点之间(行动者之间)的关系(边)

如何界定这些关系所形成的网络:节点的角色、群体、关系的强弱、关系的路径、自我网路、整体网络

社会网络分析的两大支柱:可视化、可测量

二、网络的拓扑结构

网络通常以图的形式来进行表达:

无权无向图

无权有向图

有权无向图

有权有向图

图示的内在是一张表——邻接矩阵或邻接表

source-target-weight三列表,一个矩阵就是一个网络

三、网络分析的指标

从网络整体看:连通性、密度、直径、平均路径长度、聚集系数

连通性(Connectivity): 如果网络中任意一个点都能到达网络中所有的其他点,那么网络是连通的。通常来说我们研究的网络都是连通的,然而在一些特殊的例子中我们也会看到不连通的网络,比如研究一本小说中,人物之间的帮助关系,那么我们一般会看到两个阵营,正派的角色相互帮助,反派的角色相互帮助,而两组对立的人物之间没有相互帮助。因此通过连通性的研究,我们也可以知道一本小说中人物的阵营关系。

密度(Density): 网络中实际存在的边的数量与最大可能边的数量之比,刻画网络中节点之间连边的密集程度,取值范围在【0,1】。密度越大,网络越密集,联通的互动关系。相互连结更紧密。

直径(Diameter of graph):网络中任意两个节点之间距离的最大值。这个指标也可以间接地反应一个团体连接的紧密程度。

平均路径长度:网络中任意两个节点之间距离的平均值。通常来说,如果是在小微企业中,人员数量及其有限,大家可能都相互认识,那么平均测量距离就会很短。而在大型企业中,通常会有不同的项目部等,同项目部之间相互认识但是不同的项目部门之间不认识,因此平均下来,平均测量距离就会很大

聚集系数(Clustering coefficient):刻画节点之间聚集的情况

从节点看:度、度分布、介数中心性、节点中心性、HITS算法、PageRank

度(Degree):与节点直接相连的边的数量,一个节点的度越大,意味着这个节点越重要。

出度:从节点指向其他节点边的数量

入度:从其他节点指向该节点的边的数量

(关系是有方向的)

度中心性(Degree Centrality): 一个节点直接相连的节点的个数。假如在一个社交网络中,节点代表的是人,边代表的是好友关系,那么一个节点的度中心性越大,就说明这个人的好友越多。这样的人可能是比较有名望的人物,如果需要散布一些消息的话,这样的人最适合,因为他的一条状态可以被很多很多的人看到。

核心思想:重要的节点就是拥有许多连接的节点。你的社会关系越多,你的影响力就越强。

介数中心性(Betweenness Centrality): 以经过某个节点最短路径的数目来刻画节点的重要性,衡量节点在转发信息的重要程度。就好像“咽喉要道”一样,如果联通两个节点A和B的最短路径一定经过点C,那么C的介数中心性就加一,如果说A和B最短路径有很多,其中有的最短路径不经过C,那么C的介数中心性不增加。介数中心性刻画了一个节点掌握的资源多少,在社交网络中,一个人的介数中心性越大说明这个人掌握了更多的资源而且不可替代(必须经过他,不存在其他的最短路径),就好像房屋中介一样,一边是买房的人一边是卖房的人,买卖双方要想联系就要经过中介。

核心思想:如果一个成员位于其他成员的多条最短路径上,那么该成员就是核心成员,就具有较大的中介中心性。

紧密中心性(Closeness Centrality): 某个节点到网络中所有节点距离的平均值,紧密中心性越大则说明这个节点到其他所有的节点的距离越近,越小说明越远。紧密中心性刻画了一个节点到其他所有节点的性质,在社交网络中,一个人的紧密中心性越大说明这个人能快速的联系到所有的人,可能自己认识的不多,但是有很知名的朋友,可以通过他们快速的找到其他人。

核心思想:紧密中心性高的节点一般扮演的是八婆的角色(gossiper)。他们不一定是名人,但是乐于在不同的人群之间传递消息。

特征向量中心性:Page rank特征向量中心性,指向它节点的数量以及这些节点的重要性。如谷歌网页排名中,一个网页的价值是由连结这个网页的网页决定是,类似站在巨人的肩膀上。 

核心思想:与你连接的人越重要,你也就越重要。

四、社会网络分析相关理论

社会网络分析(Social Network Analysis)是对社会关系结构及期属性加以分析的一套规范与方法。主要分析不同社会单位(个体/群体/社会)所构成的关系及其属性。

点:社会行动者

边:行动者之间的关系

结构洞(structural holes)

结构洞是“社会网络中的某个或某些个体和有些个体发生直接联系,但与其他个体不发生直接联系,无直接联系或关系间断(disconnection)的现象,从网络整体看好像网络结构中出现了洞穴”。结构洞并不是用来说明关系的强弱, 而是信息的传递机制和原因所在。


例如,在图1中,“自我”与A,B,C中的任意两者之间的关系结构就是一个结构洞。因为,A和B都与“自我”有关系,但是二者之间却不存在关系,相当于有一个空洞(hole)。“自我”如果希望把信息传递给A和B,需要分别通知;而在图2中,“自我b’仅把信息传递给A’即可,因为A’可以把信息传递给B’。结构洞能够为其占据者获取“信息利益”和“控制利益”提供机会,从而比网络中其他位置上的成员更具有竞争优势。

结构洞的竞争优势

当网络中两个联系人需要联系而没有直接联系时,一个结构洞就存在了。由于构成双边关系的个体常常共享利益、财富、权力和价值等等,结构洞少的自我封闭的网络只能提供重复的资源。富裕的结构洞将提供给个体更多资源以及更快地接触资源,并因此控制资源和产出和职业机会的优先获取权。占据结构洞位置的个体可以获得更多更新的非重复信息,并具有保持信息和控制信息两大优势:信息利益和控制利益。

信息利益通过三种形式来实现:

通路:指一个人能获得更多的信息通路,可以更早的获得有价值的信息。

先机:确认获得信息的基础上通过个人接触先于他人。

举荐:在适当的时间和地点,由于被推荐而获得机会。

控制利益:指第三者居中搭桥时,可以决定优先照顾哪一方的利益。


社会资本

通过在网路中定义节点的度数、介数和紧密数等概念,可以揭示个人在社会中拥有权利社会声望的情况,反映一个人的社会资本。社会资本更包括一种信任关系。

有关系就会有结构生成,这种结构会是类似于DNA的结构。网络结构往往呈现出一种拓扑结构,它的距离没有意义,方向没有意义,更多是显示了一种形态。


参考资料

结构洞思维:让你的人际关系网络更有效力

社会网络分析学习笔记, 重要的事情说三遍

谁是社会网络中最重要的人?

社会网络分析视野下网络问答社区健康信息传播的互动机制研究 ——以知乎网站下“HPV疫苗”话题为例

你可能感兴趣的:(【媒体大数据挖掘实战】网络分析入门篇)