社交网络分析7:社交网络舆情分析

社交网络分析7:社交网络舆情分析

  • 写在最前面
      • 主要内容预览
      • 提纲问题
  • 社交网络舆情分析
    • 舆情的定义和影响
    • 高校舆情事件特征
  • 社交网络舆情研究现状
    • 社交网络舆情演化传播建模研究
      • 基础与应用
      • 典型模型和理论
      • 创新应用
    • 社交网络舆情演化传播建模的进阶研究
      • 演化博弈理论
      • 仿真模型
    • 国内学界的贡献
      • 研究方法和模型
      • 创新模型
  • 社交网络舆情用户研究
    • 意见领袖识别
    • 情感分析
    • 机器学习和深度学习在情感分类中的应用
    • 用户信息行为研究
      • 研究内容
      • 方法论
      • 模型应用
    • 用户情感研究
      • 情感分析
      • 情感演化
  • 社交网络舆情分析方法与技术的创新研究
    • 创新方法与技术
      • 多维网络模型的应用
      • 舆情演化新模型
      • 情感分类器的发展
      • 社交网络舆情控制新方法
    • 结构洞理论
      • 理论背景
      • 结构洞的重要性
  • 社交网络舆情研判与预警研究
    • 研究范畴与目标
    • 模型构建与理论应用
    • 分析方法
    • 指标体系研究
  • 社交网络舆情引导与治理策略研究
    • 策略建模
      • 动态平衡模型
    • 策略转型与创新
      • 新时代舆情策略创新
    • 特殊话题的社交网络舆情研究
      • 政治选举、移民与种族主义话题
      • 核能话题
  • 社交网络舆情相关概念
    • 社交网络舆情的内涵
    • 社交网络舆情的构成
      • 主体
      • 本体
      • 时空
      • 载体
  • 社交网络舆情的生命周期
    • 生命周期的特性
    • 生命周期阶段划分模型
  • 舆情分析相关技术
    • 知识图谱 (Knowledge Graph, KG)
      • 基本概念
      • 技术特点
      • 结构与应用
    • 主题图谱
      • 概念与构成
      • 技术特点
      • 应用于社交网络舆情
  • 经典信息传播模型
    • 节点状态划分
    • 经典传播模型
      • SI 模型
  • 经典信息传播模型
    • SIS 模型
      • 动态特性
    • SIR 模型
    • 模型比较
  • 异质平均场方法
    • SIS 传播模型的应用
      • 概率 Θ ( t ) \Theta(t) Θ(t) 的表达式
      • ρ k ( t ) \rho_k(t) ρk(t) 的演化方程
  • 淬火平均场方法
    • SIS 传播模型的应用
  • 淬火平均场方法
    • SIS 传播模型
  • 边渗流方法
    • SIR 模型的极大连通子图
    • 边渗流理论应用
  • 基于双层网络的信息传播建模
    • 双层网络的概念
      • 特性
      • 挑战
    • 双层网络模型
      • 结构
      • 节点表示
      • 度分布
  • 双层网络上的信息传播模型
    • 双层网络模型
      • 特点
    • 信息传播模型
      • 节点状态
      • 模型特性
      • 网络层间的相互影响
    • 理论分析
  • 提纲问题
    • 1. 针对社交网络舆情演化传播机理建立的模型主要有哪些?列举 2-3 种。
    • 2. 相关理论:扎根理论、话题模型、结构洞
    • 3. 社交网络舆情的构成包括哪几个部分,简要进行说明。

写在最前面

《社交网络分析》课程由鲁宏伟老师授课,其教学方式不仅严谨负责,还充满幽默与个人见解。这个方向对我而言也尤其有吸引力,怀着极大的兴趣选修了这门课程。

七、社交网络舆情分析
主要结合PPT:社交网络舆情分析
本章简要介绍社交网络舆情分析基本概念和方法


社交网络分析7:社交网络舆情分析_第1张图片

在数字化时代,社交网络不仅重塑了我们的沟通方式,也深刻影响了舆情的形成与传播。从高校事件到政治竞选,从公共危机到品牌形象,舆情在社交网络的涟漪效应下,变得更加迅速而复杂。《社交网络分析7:社交网络舆情分析》旨在深入探讨这一现象,提供一个全面的视角来理解和分析社交网络中舆情的动态。

在这一系列博文中,我们将探索舆情的定义和影响、研究现状、演化传播建模,以及在社交网络中舆情的特定用户研究。我们会深入探讨诸如知识图谱、异质平均场方法、淬火平均场方法等先进技术在舆情分析中的应用,同时也会触及到社交网络舆情的关键组成部分以及生命周期。

主要内容预览

  • 模型与理论:我们将介绍基于双层网络的信息传播建模,以及经典信息传播模型如SI、SIS和SIR模型的动态特性。
  • 技术应用:探讨知识图谱和主题图谱等技术在社交网络舆情分析中的关键作用。
  • 舆情构成与生命周期:分析社交网络舆情的主体、本体、时空和载体,以及舆情的发展阶段。

提纲问题

  1. 模型探究:什么是社交网络舆情演化传播的主要模型?
  2. 理论框架:如何扎根理论、话题模型、结构洞理论帮助我们理解社交网络舆情?
  3. 舆情构成:社交网络舆情包含哪些关键要素?

随着社交网络在我们生活中的日益重要性,理解其舆情传播机制不仅对学者研究者有价值,对于公共管理者、企业家乃至普通网民都具有重要意义。我们期待通过这个系列,为您提供深入且实用的洞见,帮助您在这个快速变化的社交网络时代中更好地导航。

社交网络舆情分析

舆情的定义和影响

舆情,即社会情绪的集中爆发,通常围绕着某一社会突发事件的发生和发展。在特定的时空范围内,广大民众通过自我表达的观点和情绪,形成了对事件的集中反应。社交网络,作为互联网中应用范围最广、发展速度最快、民众参与最普遍且对现实生活影响最明显的产品,已成为社会突发热点事件舆情演化和爆发的重要平台。

近年来,不法分子利用社交网络的开放性、匿名性和流量效应,有组织、有目的、有计划地煽动不明真相的网民参与到突发事件的热议中。他们通过炒作话题、煽动情绪、制造对立,诱发网络舆情,导致民众对政府公信力、社会公平正义、人性美好善良的质疑,造成的社会影响是恶劣的。

高校舆情事件特征

网络舆情具有突发性强、涉及面广、影响性大的特点。在分析的 141 个高校网络舆情事件中,我们发现:

  • 高校教育管理类舆情事件 占比为 48.93%
  • 师生非正常死亡类舆情事件 占比为 17.02%
  • 高校教师师德师风及学术不端类舆情事件 占比为 12.77%
  • 师生言论不当类舆情事件 占比为 6.38%
  • 其他类舆情事件 占比为 14.89%

社交媒体平台加速了网络舆情的生成与传播。从 141 个事件来源来看,90% 以上的舆情事件首发信息曝光于新浪微博,少部分事件则是通过私人社交平台(如微信朋友圈、QQ 空间等)发布,再经由他人转发至新浪微博等社交平台。以新浪微博为代表的公共舆论空间提供了极大的自由性和便利性。新浪微博的关注机制、多元化的参与主体以及强大的信息传播能力,使其成为信息传播的重要平台。热搜功能、网民的“看客”心理和从众心理等,都成为舆情事件升级发酵的助推器。

高校网络舆情的处置如果不当,极易催生二次舆情。在传播范围广、产生影响大的舆情事件中,多数都经历了二次甚至多次传播。特别是高校在处置网络舆情时,常常采用拖延回应、隐瞒实情、禁止评论、立刻删帖等方式,反而更易激起受众的逆反心理,导致舆情严重发酵,进一步扩大了负面影响的传播范围,同时也不利于高校自身在舆论中的主导地位。

社交网络舆情研究现状

社交网络舆情演化传播建模研究

基础与应用

  • 社交网络舆情演化传播建模是理解舆情演化特征、传播特点和演化路径的关键手段。
  • 基于数学、传播学、生物学、复杂网络理论和系统动力学等,研究者结合社交网络舆情的特点进行建模仿真,以模拟或预测舆情的演化和传播过程。

典型模型和理论

  • 解释模型:如基于传染病 SI 模型的 SIR、SIS、SIRS 模型等,用于解释舆情信息的传播过程。
  • 预测模型:如独立级联模型 (ICM) 和线性阈值模型 (LTM),预测未来舆情信息的传播演化。
  • 其他理论:如博弈论、复杂网络理论等。

创新应用

  • 意见延迟转发免疫模型 (OD-SFI):结合社交网络舆情信息转发量、意见同质性和异质性指数,模拟用户意见对舆情传播效率的影响,并进行拟合和敏感性分析。

社交网络舆情演化传播建模的进阶研究

演化博弈理论

  • 通过识别舆情事件中涉及的利益相关者,构建了三方演化博弈模型,探讨了策略均衡条件,并提出管理和干预策略。

仿真模型

  • 基于无标度网络,针对自然灾害后公众在社交网络中发布的态度和意见,构建了舆情信息传播的仿真模型,评估灾难后舆情信息的传播方式和模式。

国内学界的贡献

研究方法和模型

  • 国内学者主要基于传播学、心理学、数学和系统动力学等理论,构建了社交网络舆情演化传播模型,并通过仿真实验进行验证。

创新模型

  • 四级舆情博弈模型:基于冲突分析图模型理论,构建了网民、意见领袖、媒体和政府机构的模型,并进行稳定性和均衡分析。
  • 网络舆情应对仿真模型:包括舆情事件、网民和媒体三个子系统,结合案例探究舆情传播的动态机制。
  • 反从众心理模型:将心理学研究成果引入网络舆情演化模型,量化了心理因素对舆情演化与传播的影响。
  • 情绪感染模型:在传染病 SIR 模型的基础上引入情绪感染理论,构建了包含情感倾向传播状态和用户强弱关系的模型,通过仿真实验验证了其有效性。

社交网络舆情用户研究

意见领袖识别

  • 社交网络舆情中,识别有影响力的个体是关键研究领域。
  • 典型方法基于网络拓扑学,如中心性、中介中心性、接近中心性、K-Shell 中心性等。
  • 改进方法包括 PageRank、LeaderRank、混合排名算法等。
  • 也包括基于动态网络和网络社区的方法,如节点或边的动态修改、基于社区的动态加权和算法、重叠网络社区检测与分析等。

情感分析

  • 情感分析在社交网络舆情数据处理中愈发流行,采用自然语言处理技术对用户文本数据进行情感倾向分类。
  • 国外研究者广泛使用机器学习、深度学习和基于 Transformer 的算法进行情感分析,常用 IMDB 数据集进行算法的分析和比较。
  • Transformer 算法,由 Alex Graves 提出,用于解决序列转换问题,如语音识别、文本翻译、人机对话等。知乎了解更多
  • IMDB 数据集包含 5043 部电影信息,如导演、主演、关键词描述、类型等,及其 imdb 评分。

机器学习和深度学习在情感分类中的应用

  • 常用算法包括朴素贝叶斯、决策树 (DT)、K-最邻近 (KNN)、支持向量机 (SVM)、长短期记忆模型 (LSTM)、门控循环单元 (GRU) 等。
  • 循环神经网络 (RNN) 可关联不同时间点的信息,但对所有输入赋予相同权重,难以区分重点因素。存在梯度衰减和爆炸问题,难以捕捉时间序列中长距离依赖关系。
  • 门控循环神经网络(Gated Recurrent Neural Network)作为 RNN 的升级版,解决了这些问题。知乎了解更多

用户信息行为研究

研究内容

  • 研究焦点在于分析舆情事件中用户的参与、接受、集群等信息行为的影响因素和规律。

方法论

  • 扎根理论(Grounded Theory, GT):一种从实践中归纳、建立理论的定性研究方法。研究者无初始理论假设,直接从观察出发,从原始数据中提炼理论。
  • 应用扎根理论建立用户信息接受行为的影响模型,通过深度访谈和扎根理论构建全过程视角的舆情传播行为参与机制理论模型。

模型应用

  • OCS-EGM 模型:用于模拟和监测舆情事件中的用户集群行为。
  • 改进的 LDA 话题模型:基于 Relevance 公式改进,用于提取微博话题,分析不同话题下的用户行为规律。

用户情感研究

情感分析

  • 利用情感词典与规则、机器学习和深度学习方法分析用户生成的文本中的情感倾向。
  • 常用情感词典包括大连理工大学中文情感词汇本体库、知网 How Net 情感词典、台湾大学 NTUSD 中文情感极性词典等。
  • 常用机器学习和深度学习模型包括支持向量机 (SVM)、朴素贝叶斯模型、LDA 主题模型、卷积神经网络、循环神经网络等。

情感演化

  • 在划分用户情感极性的基础上,研究舆情事件发展过程中用户情感的转移和演化,以动态展示情感变化。

社交网络舆情分析方法与技术的创新研究

创新方法与技术

多维网络模型的应用

  • 结合社会心理学和系统科学,基于舆情的多维度、多层次特性,构建了网络舆情拓扑多维网络模型。
  • 设计多维舆情话题检测算法,实证研究显示其有效性达 70%。

舆情演化新模型

  • 在用户影响力、话题流行度和兴趣度的定义基础上,结合意见融合 HK 模型和传染病 SEIR 模型,提出舆情演化 HK-SEIR 模型。
  • 分析了用户在兴趣和置信度阈值下的交互行为。

情感分类器的发展

  • 为实时评估舆情用户情感,开发了包括复杂双向长短期记忆模型的情感分类器,准确率显著提高。

社交网络舆情控制新方法

  • 基于社会网络分析和结构洞理论,提出基于结构洞的社交网络舆情控制方法(SHCPO)。
  • 通过改进的 Friedkin-Johnsen (FJ) 模型探究和分析舆情演变趋势,效率比传统方法提高了 10%。

结构洞理论

理论背景

  • 由伯特在 1992 年的《结构洞:竞争的社会结构》一书中提出。
  • 研究人际网络的结构形态,分析不同网络结构对网络行动主体的利益或回报影响。

结构洞的重要性

  • 结构洞指社会网络中的空隙,即某些个体与其他个体没有直接联系。
  • 控制结构洞的个体或组织在信息、资源和权力方面具有优势。
  • 占据更多结构洞的个人或组织在竞争中具有优势,能获取更多服务和回报。

社交网络舆情研判与预警研究

研究范畴与目标

  • 社交网络舆情研判与预警旨在对网络中的舆情信息进行价值和趋势判定,是舆情管理研究的重要部分。
  • 目标是对舆情进行全面监控,预判和预警潜在风险。

模型构建与理论应用

  • 直觉模糊 Choquet 积分模型:基于直觉模糊理论,构建考虑舆情预警指标交互性和决策者风险偏好的网络舆情预警模型。
  • SIRS 动态演化模型:探究不同演化状态下的阈值特征和舆情预警的充分条件。
  • CLOpin 跨语言舆情分析与预警知识图谱:建立跨语言知识图谱 CLKG,实现跨语言舆情研判与预警。

分析方法

  • 包括运筹学和机器学习方法,如直觉模糊推理、模糊综合评价、灰色关联分析、OCS-EGM 模型、云模型、数字孪生和 BP 神经网络等。

指标体系研究

  • 基于生命周期理论、信息生态理论和空间可视化理论构建指标体系。
  • 通过熵权法、多次模糊评价法和空间分析技术进行实证评估,确定舆情预警等级并验证指标体系的有效性。

社交网络舆情引导与治理策略研究

策略建模

动态平衡模型

  • 循证治理动态平衡模型:分析决策者能力、科学证据和公众价值的问题,基于循证治理提出完善思路。
  • 弹簧运动受力原理与系统动力学理论:构建舆情治理作用力模型,探究各作用力的相互作用。
  • 网络舆情全景生态模型:描述舆情主体、客体和环境的关系及动态平衡,提出三维度的治理策略。

策略转型与创新

新时代舆情策略创新

  • 在自媒体和新技术背景下,分析舆情信息传播机制的变化,提出舆情管控和引导机制的创新。
  • 对人工智能时代的技术流变及其对舆情治理的影响进行分析,提出基于新技术的舆情引导与治理创新措施。

特殊话题的社交网络舆情研究

政治选举、移民与种族主义话题

  • 政治选举:开发认知政治网络(CPNs)框架,对政治话题舆情的两极分化进行衡量和实证分析。
  • 移民问题:基于可识别受害者理论,研究移民事件对公众情绪的影响及其持续时间。
  • 种族主义政策反应:研究美国公众舆论与种族隔离政策的关系,为政策制定提供建议。

核能话题

  • 通过逻辑回归分析研究教育程度、政治意识形态等因素对核能舆论的影响,为核能政策制定者提供深入见解。

社交网络舆情相关概念

社交网络舆情的内涵

  • 定义:网络舆情是社会舆情在网络空间的表现,包括网民或特定社群通过互联网表达的观点集合,反映对社会事件的评价、态度、立场和情感。
  • 特性:社交网络集成了多种传播模式,打破时间和空间限制,促进信息交换和观点分享,形成社交网络舆情。
  • 典型规律:社交网络舆情常遵循“线下事件突发——线上信息引爆——线上信息扩散——线下极化扩散”的模式,表现为“线下发生,线上传递”的特点。

社交网络舆情的构成

主体

  • 定义:参与社交网络舆情的用户,包括政府、网络媒体、意见领袖、普通网民等。
  • 性质:舆情主体可以是个体用户、社会组织、机构或用户群体。

本体

  • 定义:舆情的基本内容,包含用户表达的多种观点、立场、态度和情感。
  • 表现形式:可以是文本、图片、表情符号、音频、视频等多媒体形式。

时空

  • 时间维度:包括舆情的发生、发展的各时间点和时段。
  • 空间维度:包括舆情在传播过程中所涉及的实际地理空间。

载体

  • 定义:支持舆情发生和发展的信息技术、工具、平台和社交媒体终端等。
  • 功能:作为舆情传播的虚拟介质,包括新闻网站、社交网站、博客、论坛、应用软件等。

社交网络舆情的生命周期

生命周期的特性

  • 社交网络舆情是一个动态演化的过程,具有规律性、周期性和连续性。
  • 在不同阶段,舆情的主体、本体、载体等呈现出不同特点。
  • 生命周期理论是刻画社交网络舆情阶段特征和演化路径的有效理论基础。

生命周期阶段划分模型

具有代表性的舆情生命周期阶段划分模型有三阶段、四阶段、五阶段和六阶段模型, 每个模型的阶段细分各有差异。

  • 三阶段模型划分模式:按照“发生、变化和结束”进行舆情的生命周期划分。

  • 四阶段模型特点:在三阶段模型基础上扩展,视舆情为连续线性系统,考虑内在变动过程。

  • 五阶段模型特点:结合网络媒介和网民特性,从线性连续和动态发展角度进行生命周期阶段划分。

  • 六阶段模型特点:结合 Web 2.0 环境下社交网络舆情特点,从信息传播学角度进行阶段划分。

舆情分析相关技术

知识图谱 (Knowledge Graph, KG)

基本概念

  • 知识图谱是一种图结构知识库,由实体、概念和属性组成,描述客观现实世界中的概念、实体及其关系。

技术特点

  • 作为图模型的知识描述和关系建模技术,实现信息检索和知识推理。
  • Google 的知识图谱是一种语义网络,能从数据中获取知识,并将其结构化表示。

结构与应用

  • 以三元组形式存储数据和知识,建立语义链接。
  • 节点代表实体或概念,边代表它们之间的语义关系。
  • 吸收语义网的优点,注重通过图形表现实体间的关联。

主题图谱

概念与构成

  • 主题图谱存储和表示特定主题的知识及其逻辑或语义关系,形成有向图结构的知识库。
  • 以实体为节点、关系为边,形成语义关系网络。

技术特点

  • 分布式的知识表示方法,通过可视化网络揭示知识间的联系。
  • 实现知识的集成、共享、互联和推理。

应用于社交网络舆情

  • 主题图谱的构建有助于分析非结构化舆情信息。
  • 识别关键节点和关系、探明关键要素及特征、把握社交媒体的传播特点和规律。

为了优化文章《经典信息传播模型》的表述,并运用 Markdown 语法,我将对其内容进行重组和补充。以下是优化后的内容:


经典信息传播模型

节点状态划分

在信息传播模型中,节点通常分为以下三种状态:

  1. 易感态(Susceptible State):节点未得知信息,但可能未来获得信息。
  2. 已知态(Informed State):节点已得知信息,并可能向其他节点传播信息。
  3. 恢复态(Recovered State):节点得知信息后对其失去兴趣,不再传播信息。

经典传播模型

SI 模型

  • 概念:SI 模型是一种简单的传播动力学模型,节点只存在易感态(S)和已知态(I)两种状态。
  • 状态变化:节点从 S 态转变到 I 态的过程,其中 λ 代表节点以概率 λ 接受信息。
  • 应用:可模拟通知或新闻等信息的传播。
  • 过程
    • 传播开始时,选定一个或几个种子节点为 I 态,其他节点为 S 态。
    • 每个时间步,I 态节点以概率 λ 向 S 态邻居传播信息。
    • 重复此过程,直至所有节点变为 I 态。
  • 传播演化:I 态节点比例最初增长迅速,但随时间增长逐渐减慢,直到网络中所有节点都成为 I 态。

经典信息传播模型

SIS 模型

  • 基本概念:SIS 模型是基于 SI 模型的扩展,其中节点可以从易感态(S)转变为已知态(I),并可能再次回到易感态(S)。

  • 状态转换:节点从 S 态以概率 λ 转变为 I 态,然后以概率 γ 从 I 态恢复为 S 态。

动态特性

  • 当 λ > γ 时,I 态节点比例会稳定在一个非零值。

  • 当 λ < γ 时,I 态节点比例随时间衰减为零。

  • 基本再生数:定义为 R = λ/γ,是传播阈值的衡量标准。

SIR 模型

  • 基本概念:SIR 模型是基于 SI 模型的另一种扩展,加入了恢复态(R),使得传播过程成为非可逆。

  • 状态转换:节点从易感态(S)转变为已知态(I),然后转变为恢复态(R)。

  • 应用:常用于模拟谣言等信息的传播。

  • 有效传播概率:定义为 β = λ/γ,用于衡量传播过程的有效性。

  • 动态特性:I 态节点比例随时间增长后衰减为零,当有效传播概率小于某一阈值时,信息最终消失。

模型比较

比较 SI、SIS 和 SIR 模型

  • 三种模型中,SI 模型中 I 态节点增长最快。
  • 在 SIS 和 SIR 模型中,恢复概率的存在导致 I 态节点增长较慢,且存在传播阈值。

异质平均场方法

异质平均场方法由 Pastor-Satorras 和 Vespignani 提出,用于解决网络传播动力学问题。此方法基于假设:度相同的节点在动力学上不存在差异性。

SIS 传播模型的应用

以无关联网络中的 SIS 传播模型为例,我们使用异质平均场方法来求解信息的传播阈值和最终传播范围。其中, ρ k ( t ) \rho_k(t) ρk(t) 表示在时刻 t t t,度为 k k k 的节点处于 I 态的概率。系统中 I 态节点的比例为:

ρ ( ∞ ) = ∑ k p ( k ) ρ k ( ∞ ) \rho(\infty) = \sum_k p(k) \rho_k(\infty) ρ()=kp(k)ρk()

这里, p ( k ) p(k) p(k) 是网络中度为 k k k 的节点比例,而 ρ ( ∞ ) \rho(\infty) ρ() 是最终传播范围的目标求解值。

概率 Θ ( t ) \Theta(t) Θ(t) 的表达式

Θ ( t ) \Theta(t) Θ(t) 表示 S 态节点连接到一个 I 态邻居的概率,在无关联网络中表达式为:

Θ ( t ) = ∑ k k p ( k ) ρ k ( t ) ⟨ k ⟩ \Theta(t) = \sum_k \frac{k p(k) \rho_k(t)}{\langle k \rangle} Θ(t)=kkkp(k)ρk(t)

ρ k ( t ) \rho_k(t) ρk(t) 的演化方程

根据 SIS 模型的演化规律,我们得到 ρ k ( t ) \rho_k(t) ρk(t) 的演化方程:

d ρ k ( t ) d t = − ρ k ( t ) + λ k ( 1 − ρ k ( t ) ) Θ ( t ) \frac{d\rho_k(t)}{dt} = -\rho_k(t) + \lambda k (1 - \rho_k(t)) \Theta(t) dtdρk(t)=ρk(t)+λk(1ρk(t))Θ(t)

这里方程右侧的第一项代表 I 态节点恢复为 S 态的概率,第二项则是 S 态节点转变为 I 态的概率。

淬火平均场方法

淬火平均场方法在异质平均场方法的基础上发展而来,区别在于使用网络的邻接矩阵 A A A,描述网络的所有特性。

SIS 传播模型的应用

在无关联网络上的 SIS 传播模型中,淬火平均场方法考虑每个节点的状态变化。用 p i ( t ) p_i(t) pi(t) 表示节点 i i i 在时刻 t t t 处于 I 态的概率,则网络中 I 态节点的比例为:

ρ ( t ) = 1 N ∑ i p i ( t ) \rho(t) = \frac{1}{N} \sum_i p_i(t) ρ(t)=N1ipi(t)

淬火平均场方法

淬火平均场方法通过考虑网络中每个节点的状态变化来研究传播动力学,特别是在无关联网络上的 SIS 传播模型中。使用网络的邻接矩阵 A A A,这种方法能够更准确地描述网络的复杂性。

SIS 传播模型

  • p i ( t ) p_i(t) pi(t) 表示节点 i i i 处于 I 态的概率。
  • 网络中 I 态节点的比例为 ρ ( t ) = 1 N ∑ i p i ( t ) \rho(t) = \frac{1}{N} \sum_i p_i(t) ρ(t)=N1ipi(t)

边渗流方法

边渗流方法是解析 SIR 传播模型最终传播范围的重要理论工具,特别是在考虑非可逆传播过程时。

SIR 模型的极大连通子图

  • SIR 传播模型的最终传播范围可以通过求解边渗流理论中极大连通子图的大小来实现。
  • 假设 I 态节点以概率 λ \lambda λ 将信息传播给 S 态邻居,并在 τ \tau τ 步后转变为 R 态。
  • 有效传播概率 ϕ \phi ϕ 是 I 态节点在恢复前通过连边将信息传递给 S 态邻居的概率。

边渗流理论应用

  • 在树形网络中,极大连通子图的大小 g g g 可以通过数值求解特定方程获得。
  • 当特定方程在 u = 1 u = 1 u=1 的位置相切时,可以得到临界传播概率 ϕ c \phi_c ϕc 的表达式。
  • 利用边渗流理论可以方便地求解 SIR 模型的传播阈值和最终传播范围。
  • 学者们已将传统边渗流理论拓展,用于研究度关联和社区结构等对 SIR 传播模型的影响。

基于双层网络的信息传播建模

双层网络的概念

双层网络是由两个子网络层共同构成的复杂网络系统,常见于真实世界的许多网络系统。

特性

  • 在双层网络中,个体可同时活跃在两个网络层,导致信息可同时在两个子网络层中传播。
  • 例如,在社交媒体系统中,个体可以通过两个社交平台或同一平台上的两种不同方式传播信息。
  • 这种信息传播动力学的研究对理论和实际应用均具有重要意义。

挑战

  • 双层网络结构的复杂性以及节点间动力学关联性的描述难度,使得对其信息传播进行理论建模和分析具有较大难度。

双层网络模型

结构

  • 双层网络由两个子网组成,分别称为网络层 A 和 B。
  • 每层子网都有 N 个节点,代表 N 个个体,节点间的连边代表个体之间的社会联系。
  • 不同层可能具有不同的结构,因此动力学特性也不同。
  • 两层中的节点一对一匹配,每个个体在两个社交平台均有活跃。

节点表示

  • 任意个体 u u u 在网络 A 和 B 中分别对应节点 u A u_A uA u B u_B uB
  • 节点 u A u_A uA ( u B u_B uB) 在层 A(B)中的度表示为 k A k_A kA ( k B k_B kB)。

度分布

  • 联合分布概率 P ( k A , k B ) P(k_A, k_B) P(kA,kB) 表示随机选择的节点对 ( u A , u B ) (u_A, u_B) (uA,uB) 在层 A 具有度 k A k_A kA 同时在层 B 具有度 k B k_B kB 的概率。

双层网络上的信息传播模型

双层网络模型

双层网络由两个互相关联的子网组成,每个子网代表一个网络层(网络层 A 和 B)。

特点

  • 每个层包含 N 个节点,代表个体,节点间的连边表示社会联系。
  • 两层网络可能具有不同的内部结构。
  • 层间度关联可能存在,由联合分布 P ( k A , k B ) P(k_A, k_B) P(kA,kB) 决定。

信息传播模型

节点状态

  • 易感态(S):节点对信息不知情,等待邻居传递信息。
  • 已知态(I):节点已获取信息,并可能传播给易感态邻居。
  • 恢复态(R):节点失去对信息的兴趣,不再传播信息。

模型特性

  • 初始时,选择部分节点为种子个体,状态设为 I。
  • 在每个时间步,网络中的 I 态节点以概率 λ \lambda λ 将信息传播给 S 态邻居。
  • I 态节点以概率 1 − ( 1 − γ ) n 1 - (1 - \gamma)^n 1(1γ)n 转变为 R 态,其中 n n n 是该节点对应个体在两层网络中的 I 或 R 态邻居数量。
  • 有效传播概率定义为 β = λ / γ \beta = \lambda/\gamma β=λ/γ,其最小值 β c \beta_c βc 是信息的传播阈值。

网络层间的相互影响

  • 任一节点进入 I 态或 R 态,则其在另一层的对应节点也同时转变状态。
  • 信息传播终止时,网络中节点非 S 态即 R 态,R 态节点比例即为信息的最终传播范围。

理论分析

  • 使用异质边划分理论预测信息的最终传播范围。
  • 基于稳定性分析的理论方法获取信息的传播阈值。

提纲问题

七、社交网络舆情分析

1. 针对社交网络舆情演化传播机理建立的模型主要有哪些?列举 2-3 种。

针对社交网络舆情演化传播机理建立的模型主要包括:

  1. SIR模型、SIS模型、SIRS模型:这些基于传染病SI模型的变种,用于解释舆情信息传播过程。它们通过模拟信息传播的“易感-感染-恢复”等状态变化来模拟舆情的传播。

  2. 独立级联模型(ICM)和线性阈值模型(LTM):这些模型用于预测未来舆情信息的传播演化。通过考虑个体间的相互作用和影响阈值,这些模型可以预测信息传播的演化趋势。

  3. 意见延迟转发免疫模型(OD-SFI):此模型结合社交网络中的舆情信息转发量、意见同质性和异质性指数,模拟用户意见对舆情传播效率的影响,并通过实际数据进行拟合和敏感性分析。

以上模型为社交网络舆情分析提供了理论基础和实用工具,有助于更准确地理解和预测舆情的演化和传播过程。

2. 相关理论:扎根理论、话题模型、结构洞

关于社交网络分析领域的相关理论,扎根理论、话题模型和结构洞是重要的理论框架:

  1. 扎根理论(Grounded Theory, GT):这是一种定性研究方法,其主要宗旨是从经验资料的基础上建立理论。研究者在研究开始之前通常没有理论假设,而是直接从实际观察开始,从原始资料中归纳经验概括,然后上升到系统的理论。这是一种从下往上构建实质理论的方法,即在系统性收集资料的基础上寻找反映事物现象本质的核心概念,进而建构相关的社会理论。

  2. 话题模型:这是一种用于发现文档集合中话题的统计方法。常见的话题模型包括LSA、PLSA、LDA等。LDA(Latent Dirichlet Allocation)是表现最好的话题模型之一,被称为三层贝叶斯概率模型,包含词语、话题和文档三层结构。在社交网络舆情用户研究中,LDA话题模型常用于提取微博等社交媒体中的话题,并分析不同话题下的用户行为规律。

  3. 结构洞理论(Structural Holes Theory):这个理论研究人际网络的结构形态,分析怎样的网络结构能为网络行动主体带来更多的利益或回报。如果两个个体之间缺少直接联系,而必须通过第三者才能形成联系,则第三者在关系网络中占据了一个结构洞。结构洞的存在意味着信息、资源与权力的差异,伯特(Burt)认为个人在网络中的位置比关系的强弱更重要,其位置决定了个人在网络中的信息、资源与权力。

这些理论为社交网络分析提供了重要的理论框架和方法论,有助于更深入地理解和分析社交网络中的行为、信息流动和影响力结构。

3. 社交网络舆情的构成包括哪几个部分,简要进行说明。

社交网络舆情主要由以下几个部分构成:

  1. 主体:指参与社交网络舆情的用户,他们是舆情发生和发展的主要促成者和推动者。这些主体不是单一的,舆情的发生和发展过程通常涉及到不同类型的主体,例如政府、网络媒体、意见领袖、普通网民等。这些主体既可以是单个用户,也可以是特定的社会组织、机构或用户群体。

  2. 本体:是舆情的基本内容,包括参与社交网络舆情的用户的全部意识形态,即用户所表达的多种观点、立场、态度以及情感的交错总和。舆情本体具有不同的表现形式,可以是传统的文本,也可以是图片、表情符号、音频、视频以及外部链接等多媒体形式。

  3. 时空:社交网络舆情时空指的是舆情发生的时间和空间环境。这一部分反映了舆情事件发生的具体时间点和发展的地理环境。

  4. 载体:指支撑社交网络舆情发生和发展的各种信息技术、工具、平台以及社交媒体终端。载体作为舆情传播的虚拟介质,包括但不限于各类新闻网站、社交网站、博客、论坛、应用软件及其提供的各种信息生成、传播、接收、处理等技术。

这些部分共同构成了社交网络舆情的整体框架,涵盖了从舆情的产生到结束的整个过程。

你可能感兴趣的:(#,社交网络分析,科研笔记与实践,数据挖掘,网络,数据挖掘,机器学习,自然语言处理,回归,人工智能,交友)