《社交网络分析》课程由鲁宏伟老师授课,其教学方式不仅严谨负责,还充满幽默与个人见解。这个方向对我而言也尤其有吸引力,怀着极大的兴趣选修了这门课程。
五、社交网络链路预测方法
主要结合PPT:社交网络信息传播动力学分析
重点介绍一种物理系统模型
欢迎来到探索社交网络信息传播动力学
的博客。
随着社交网络在我们生活中扮演着越来越核心的角色,理解信息如何在这些复杂网络中传播变得至关重要。在这篇博客中,我们将深入挖掘信息传播的动力学原理,从基本的研究概述到复杂的数学模型,再到实际应用和未来发展的前景。
我们将首先介绍信息传播的各个方面,包括传播、接收、发布和反馈的过程,以及如何预测和控制这些过程。接着,我们将深入研究社交网络信息传播的不同模型,包括传染病模型、博弈模型和物理系统模型,并探讨它们的特点和相互之间的比较。我们还会讨论新的物理学模型的提出及其在理论和实践中的意义。
随着探索深入,将聚焦于社交网络信息传播动力学分析,从基本特征提取到信息传播运动、受力分析,以及信息传播的演化过程。其中,详细解析信息能量的传递与转换,以及信息传播过程中能量的衰减和传播终结。
此外,还将探讨社交网络信息传播在社交营销、舆论引导和社交媒体分析中的应用,以及面临的挑战和未来的发展趋势。
让我们一起开始这趟揭示信息传播奥秘的旅程吧!
在研究信息传播动力学时,我们关注的是信息在不同环境下的传播过程及其要素。这一过程可以被细分为以下几个关键部分:
在线社交网络上信息传播过程研究的核心问题之一是如何预测系统的变化。由于信息传播过程一般不能用线性系统表述,因此大多数情况下我们采用非线性动力学方法来进行建模。为了预测系统的未来状态,我们需要根据系统过去的历史数据和当前的状态信息,了解其在微小时间尺度的性质。
在社交网络信息传播研究中,不同的模型被用来模拟和理解信息如何在网络中传播。这些模型通常分为三类:传染病模型、博弈模型和物理系统模型。
每种模型都有其独特的要素,这些要素帮助我们理解和预测社交网络中的信息传播行为。
传播者:发起和传递信息的人或组织
受众:接收和传播信息的人或组织
信息:被传播的内容和形式
传播渠道:信息传递的途径和媒介
这一部分将介绍各种模型的数学表达方式,以及它们是如何应用于社交网络信息传播的。
传染病模型是信息传播领域公认为比较成熟的模型,它将人群分为易感者(Susceptible)、感染者(Infectious)和治愈者(Recovered),信息从感染者传到易感者,易感者收到信息并成功转发后,自身转变为治愈者,完成个体状态的转换,直至系统达到一种稳定状态。
传统模型有 SI、SIR、SIS,这些模型均无法反映易感者转换为感染者之前有个潜伏期的事实,为此引入潜伏状态(Exposed),产生了 SEIR 模型在该类模型的发展过程中,近几年随着应用场景的不同出现了许多变体,比如具有两个时滞和垂直转移的 SEIRS 模型、基于情感交流的 HIT-SCIR模型和基于用户情绪的 SISa 模型等。
感染率:表示每个感染者平均能够传染给多少个易感者。
潜伏期:指从感染到发病的潜伏时间,这段时间内感染者可以传染给其他人。
免疫率:指人群中能够抵抗病毒的个体所占的百分比。
康复率:指从发病到康复的时间比例。
SI(Susceptible-Infected)模型:这是最基本的传染病模型,它假设个体只有两种状态:易感染(Susceptible)和已感染(Infected)。在这个模型中,易感个体与感染者接触后,就会变成感染者。
SIR(Susceptible-Infected-Recovered)模型:在SI模型的基础上增加了恢复(Recovered)状态。感染者在一段时间后会变成恢复者,恢复者不会再次感染。
SIS(Susceptible-Infected-Susceptible)模型:与SIR模型不同,SIS模型中的个体在感染后并不会获得免疫,而是会再次变成易感状态。
SEIR(Susceptible-Exposed-Infected-Recovered)模型:在SIR模型的基础上增加了暴露(Exposed)状态,即个体已经接触病原体但还没有表现出感染。
SEIRS(Susceptible-Exposed-Infected-Recovered-Susceptible)模型:在SEIR模型的基础上,增加了从恢复状态回到易感状态的过程。
SISa(Susceptible-Infected-Susceptible with Awareness)模型:是SIS模型的扩展,增加了对个体意识和行为的考虑,例如预防措施的影响。
SCIR(Susceptible-Connected-Infected-Recovered)模型:在SIR模型基础上,考虑了网络中个体的连接性对传播过程的影响。
局部相互作用博弈模型:在这个模型中,个体的决策是基于其邻居的行为,强调社交网络中的局部交互。
网络演化博弈模型:此模型融合了网络理论和博弈理论,考虑了网络结构对策略演化的影响。
社交演化博弈模型:侧重于社交行为在时间上的演化过程,考虑了网络动态变化。
进化博弈模型:强调策略的演化过程,考虑了个体之间的相互作用和适应性行为。
物理系统模型是分析在线社交网络用户特征和网络属性,借用物理学中有关的理论和方法,模拟在线社交网络中社交力量对信息传播的推动过程。
社会粒子寻求社会普适有序
理论认为,信息传播具有社会普朗克现象和量子化特性,个体社会行为可以揭示在线社交网络空间中信息不断复制、感染、扩散、传播的过程,因此可以通过建模和实证分析预测信息传播的趋势。
这类模型的最新研究成果主要有人类社会动力学模型、社交影响力模型、引力势模型和 Lotka-Volterra 模型。
人类社会动力学模型:使用物理学的原理来模拟人类社会行为的动态变化。
社交影响力模型:侧重于社交网络中影响力的传播和动态。
引力势模型:借鉴了天体物理学中的引力理论来解释社交网络中的吸引力和排斥力。
Lotka-Volterra模型:通常用于生态系统中捕食者和猎物的动态,但也被应用于模拟信息或行为在社交网络中的传播。
传染病模型在宏观层面运用平均场理论建模,忽略用户个体特征,不关注具体用户的行为,只能反映信息传播的大致趋势,模型精度并不高。
博弈模型重视个体间的交互行为,注重用户在互动中的动机,具体采用的策略简单划分为背叛与合作,相应带来不同的收益,这种划分过于武断,而且人的行为具有不确定性,模型较难准确模拟真实传播过程。
物理系统模型在深入研究社会物理现象后,借鉴经典物理论和方法,构建出信息传播模型,能从某个方面较为真实地反映信息传播的客观规律和作用机制。
然而,目前基于物理运行系统对信息传播问题的研究,在提取特征时过于简单,忽略了很多比较重要的因素,并未系统地、深层次地分析和解决此类问题,模型精度较低。
因此,对于在线社交网络上的信息传播问题,还需要从人、物和环境角度和系统观点,分析更加客观、更加深层次的物理过程,从而诠释信息传播作用机制。
在深入分析在线社交网络上信息传播物理现象的基础上,首先从时间、空间、行为人和信息 4 个维度上提取特征参量,进行形式化定义和归一化处理,全方位多视角地剖析传播活动;
然后借鉴运动学、动力学和系统论知识,从信息传播速度及加速度、内外受力和信息能量守恒方面对信息传播过程进行研究,构建出一种基于时变阻尼运动(Time-Varying Damped Motion,TVDM) 的信息传播动力学模型;
最后通过一系列实验,与真实数据进行对比,检验本章模型的有效性和精确性。
在社交网络中,信息的传播是一个复杂的动态过程。本文从不同维度分析信息传播的特性和动力学原理。
在线频率表征用户登录在线社交网络的时间行为习惯。我们用在线角频率 ω \omega ω 来定量刻画。例如,如果用户每天有 n n n 小时在线,那么在线角频率可以表示为: ω = 2 π 24 \omega = \frac{2\pi}{24} ω=242π
上线时差表征用户登录社交网络的时间先后关系,用初相位 ϕ \phi ϕ 表示。它反映了用户接收和转发信息的时延。例如,正在西方国家传播的信息可能需要一定时间才能在东方国家流传开来。
在下图中,用户 A 和 B 都向用户 C 转发一条相同的信息,但是从时间序列上 看,
用户 C 与用户 A 同相,与用户 B 反相,以至于用户 C 能及时收到用户 A 发 来的信息,而用户 B 的信息被忽略。
亲密程度表示用户在社交关系网中的局部重要性,通常用亲密度权重 w w w 来刻画。在信息传播中,人们倾向于相信亲朋好友的信息,而对陌生人的信息往往持观
望态度或质疑态度。在社交网络上,亲密度权重 w w w 通常服从参数为 λ \lambda λ 的指数分布,即: w ∼ exp ( λ ) w \sim \exp(\lambda) w∼exp(λ)
分享意愿描述用户向其他用户发布或转发信息的主观能动性,用分享系数 S S S 来刻画。它表示用户间一对多的群体交互信息行为,具有方向性。它受多种因素影响,如用户的性格、状态等,总体服从正态分布: S ∼ N ( μ , σ 2 ) S \sim N(\mu, \sigma^2) S∼N(μ,σ2)
社会声誉是指其他用户对某用户的综合评价。在社交网络中,声誉系数 R R R 通常服从正态分布: R ∼ N ( μ , σ 2 ) R \sim N(\mu, \sigma^2) R∼N(μ,σ2)
信息之所以能在网络中传播,是因为它具有能量 E E E,包括信息势能 U U U 和信息动能 K K K 两种。信息能量等于信息势能和信息动能之和,即: E = U + K E = U + K E=U+K
例如,在图中,用户 A 发布的信息经用户 B 、 C 传播到用户 D 后终止。
其物理过程为:
① 用户 A 在T1 周期内上线,向邻居节点传播扩散一条信息;
② 用户B在T2周期内上线,阅读并向自己的邻居节点转发该信息;
③ 类似地,用户 C 在T3 周期内上线,阅读并转发该信息;
④ 用户D在T4周期内上线阅读该信息,但不再转发,于是传播链上的信息传播活动结束。
为了简化问题,下面先考察一种最简单的情况—忽略受众对信息的排斥作用和媒体的宏观引导作用。此时,传播距离仅与传播者个体属性、网络结构和信息本身有关,结合前面的定义,可将传播距离表示为
式中, x 为传播距离, E 为传播能量, S 为分享系数, R 为声誉系数, ω 为在线角频率, t 为信息传播时间, n 为每天在线小时数, φ 为上线时差。函数 r(t)为斜坡函数,表示节点在一个周期内解读信息的时间越长,对信息理解越深刻,之后评论和转发的信息就越权威,信息传播距离也就越远。
在在线社交网络中,信息传播的核心是信息能量在不同节点间的传递与转换。根据能量守恒原理,能量不会无故产生或消失,只会在网络节点间传递,并且能量的形式可以相互转换,通常以信息动能和信息势能的形式存在。
当某个节点拥有势能差的信息时,信息将向邻居节点传播,进入运动状态。在传播过程中,信息能量全部转换为信息动能。
在两节点间的传递过程中,信息需要克服受众理性排斥力和社会舆论场力的作用,因此能量逐渐衰减。传播路径越长,信息能量衰减越严重。当信息能量过小,不足以继续传播时,信息传播过程自然终结。
对于整个网络系统,信息传递算法类似于在线社交网络图上的广度优先遍历算法。从发布信息的初始节点(种子节点)开始,信息被向各个方向传播,形成信息覆盖面。在传播过程中,信息能量 E E E 逐渐减小,当所有传播路径上的信息能量都衰减到足够小时,传播活动停止。
两个用户之间信息传递和信息能量转换的关系如图所示。
两个节点之间的信息传递算法,算法流程图为:
在社交网络系统中,信息传播可以被视为执行一种广度优先遍历(Breadth-First Search, BFS)算法。这个过程可以分为以下几个阶段:
在信息的传播过程中,信息能量的消耗是不可避免的。这种能量消耗主要是为了克服两种力量:
随着信息传播链的延长,信息能量 E E E 会逐渐减小。当传播路径上的信息能量衰减到一个足够小的程度(趋近于零),信息传播活动自然而然地终止。
五、社交网络信息传播动力学分析
信息传播动力学研究的目标是预测系统的变化,尤其是在线社交网络上信息传播的情况。这种研究通常采用非线性动力学方法来模拟信息传播过程,因为这些过程通常不能用线性系统来描述。它涉及使用历史数据和系统当前状态信息来预测其未来,需要理解系统在小时间尺度上的属性,并制定动态方程来描述这些变化。
传播模型的基本要素主要包括以下几个方面:
这些要素共同作用,决定了信息在社交网络中的传播效果和影响范围。
社交网络传播模型主要分为以下几类,并各有其特点:
传染病模型:如SI、SIR、SIS、SEIR、SEIRS、SISa、SCIR模型。这些模型通过模拟疾病的传播过程来理解信息在网络中的传播,适用于预测信息传播速度和范围。
博弈模型:包括局部相互作用博弈模型、网络演化博弈模型、社交演化博弈模型和进化博弈模型。这类模型侧重于分析个体间的互动和决策过程,适用于研究信息传播中的人际互动和影响。
物理系统模型:如人类社会动力学模型、社交影响力模型、引力势模型和Lotka-Volterra模型。这些模型采用物理学原理来分析社交网络的结构和动态,适合研究网络结构对信息传播的影响。
TVDM模型从以下四个维度提取影响信息传播的基本特征:
这些维度共同构成了TVDM模型的分析框架,用以深入理解社交网络中信息传播的动力学过程。
在建立TVDM模型的过程中,应用了多个领域的知识,主要包括:
这些领域的知识共同构成了TVDM模型的理论基础,使其能够准确地模拟和预测社交网络中的信息传播过程。
在对TVDM模型进行数值模拟和仿真时,模型建立者通常会根据以下几个方面来确定模型中的超参数:
这些方法结合使用,能够帮助模型建立者科学合理地确定模型中的超参数,以确保模型的准确性和可靠性。