- 2017年俄罗斯赞助内容在美国的策略与传播分析;
- 揭示大规模社会网络中社区的复杂重叠模式;
- 图拉普拉斯混合模型;
- 大型同构二元乘法属性图模型度分布的对数正态性;
- 水电、蓄电和输电在中国电力系统脱碳中的作用;
- 有元数据的映射方程:改变属性在社区检测中的作用;
- 社区是带凝聚核的良好分离子图:边社区中核心-边缘结构的识别;
2017年俄罗斯赞助内容在美国的策略与传播分析
原文标题: Analysis of Strategy and Spread of Russia-sponsored Content in the US in 2017
地址: http://arxiv.org/abs/1810.10033
作者: Alexander Spangher, Gireeja Ranade, Besmira Nushi, Adam Fourney, Eric Horvitz
摘要: 总部设在俄罗斯的互联网研究机构(IRA)在2016年总统大选前后在美国开展了广泛的宣传活动。该组织创建了一系列广泛的互联网资产:网络域名,Facebook页面和Twitter机器人,它们通过购买的Facebook广告,推文和索引其域名的搜索引擎获得流量。我们调查了2017年IRA活动的范围,将来自Facebook和Twitter的数据与来自Internet Explorer 11和Edge浏览器以及Bing.com搜索引擎的日志相结合。这些研究表明恶意行为者可以轻松利用社交媒体和搜索引擎进行宣传活动,以及通过融合来自多个互联网服务的内容和活动资源来跟踪和理解此类活动的能力。我们展示了跨平台分析如何为试图操纵民主国家的意见和选举提供前所未有的视角。
揭示大规模社会网络中社区的复杂重叠模式
原文标题: Uncovering Complex Overlapping Pattern of Communities in Large-scale Social Networks
地址: http://arxiv.org/abs/1810.10034
作者: Elvis H. W. Xu, Pak Ming Hui
摘要: 当每个顶点参与多个社区时,有利于内部边与出境边的高比率的社区的传统概念变得无效。这种行为在社会网络中很常见。社区之间的重大重叠使得大多数现有的社区检测算法无效。缺乏有效和高效的工具导致很少有关于实际社会网络中重叠社区结构的大规模检测和分析的实证研究。我们最近开发了一种可扩展且准确的方法,称为部分社区合并算法(PCMA),具有线性复杂性,并通过分析两个在线社会网络,新浪微博和Friendster,分别有79.4和6960万个顶点来证明其有效性。在这里,我们报告了对290万个被发现社区的深入分析,以揭示其复杂的重叠结构。每个社区通常与大量其他社区重叠,并且具有比内部边更多的出站边。然而,社区仍然相互分离。社区中的大多数顶点都是多成员顶点,它们可以位于核心或外围。整个网络的近一半可以由极其密集的社区网络来解释,社区是顶点,重叠是边。实证研究结果要求重新思考社区的概念,尤其是社区的边界。意识到重要的是边是如何组织的,f-core被建议作为社会网络中重叠社区的合适概念。结果为重叠社区的理解提供了新的视角。
图拉普拉斯混合模型
原文标题: Graph Laplacian mixture model
地址: http://arxiv.org/abs/1810.10053
作者: Hermina Petric Maretic, Pascal Frossard
摘要: 最近,图学习方法作为推断数据集中的结构的手段越来越受到关注。大多数最近的方法关注于图和数据样本分布之间的不同关系,主要是在所有可用与相同图相关的设置中。然而,情况并非总是如此,因为数据通常以混合形式提供,因此需要能够处理混合数据并学习多个图的方法。我们提出了一种新颖的生成模型,它解释了自然生活在不同图表上的不同数据的集合。我们假设数据到图的映射是未知的,并且研究了联合聚类一组数据和学习每个聚类的图的问题。合成数据集和现实数据集中的实验在数据聚类方面以及混合数据的多图推断方面都表现出了良好的性能。
大型同构二元乘法属性图模型度分布的对数正态性
原文标题: On the log-normality of the degree distribution in large homogeneous binary multiplicative attribute graph models
地址: http://arxiv.org/abs/1810.10114
作者: Sikai Qu, Armand M. Makowski
摘要: Kim和Leskovec引入了多重属性图(MAG)模型作为网络的数学易处理模型,其中网络结构被认为是由与各个节点相关联的特征或属性整形的。对于大型齐次二元MAG,他们通过近似论证认为“度数分布的尾部遵循对数正态分布”,因为节点的数量变得无限大,并且属性的数量与节点的数量成对数比例。在相同的限制条件下,我们重新考虑了度分布的渐近行为:在较弱的条件下,我们得到了对数正态性的精确收敛结果,从它推导出对数正态近似到度分布,并导出了各种收敛速度。特别地,我们表明节点度的某个变换在分布中收敛到对数正态分布,并以Berry-Esseen类型估计的形式给出其收敛速度。
水电、蓄电和输电在中国电力系统脱碳中的作用
原文标题: Role of hydro power, storage and transmission in the decarbonization of the Chinese power system
地址: http://arxiv.org/abs/1810.10347
作者: Hailiang Liu, Tom Brown, Gorm Bruun Andresen, David P. Schlachtberger, Martin Greiner
摘要: 电力部门的深度脱碳需要风能和太阳能光伏等可再生能源的高渗透率。水力发电和存储补充了它们的高时间波动性,并且相互连接的输电基础设施通过在空间维度中移动电力来帮助实现功率平衡。我们通过部署31个节点的每小时解决技术经济优化模型,研究具有成本优化的中国电力系统,该目标是雄心勃勃的 CO_2 减排目标,该模型由经过验证的38年长期数据集支持。通过一个新的,更现实的水库水力模型,我们发现,在2050年,如果CO_2减排量超过70%,那么水力,电池和氢气等储存设施就必须达到适中的系统成本。数值结果表明,这些柔性组件可以将可再生限电降低三分之二,使太阳能光伏发电的份额提高一倍,有助于满足夏季降温需求。我们表明,在区域互连之上扩展单向高压直流线路在技术上比超高压交流连接的“单网”并网更加经济。最后,将传输量限制高达25%不会使总成本更高,而对电池存储的显著需求即使具有充足的互连性也具有约束力。
有元数据的映射方程:改变属性在社区检测中的作用
原文标题: A Map Equation with Metadata: Varying the Role of Attributes in Community Detection
地址: http://arxiv.org/abs/1810.10433
作者: Scott Emmons, Peter J. Mucha
摘要: 正如No Free Lunch定理正式陈述[1],用于检测网络中的社区的算法必须进行权衡。在这项工作中,我们提出了一种使用元数据来告知权衡决策的方法。我们通过引入调整参数来扩展内容映射方程,该方程将元数据熵添加到传统的映射方程,允许明确指定元数据在分配社区标签时的相对重要性。在合成网络上,我们展示了节点元数据的调整如何与可检测性限制相关,并且在经验网络上,我们展示了节点元数据的增加调整如何在传统地图方程中以成本增加与元数据的互信息。我们的调整参数,如显微镜的聚焦旋钮,允许用户在对元数据有不同程度关注的社区“放大”和“缩小”。
社区是带凝聚核的良好分离子图:边社区中核心-边缘结构的识别
原文标题: Communities as Well Separated Subgraphs With Cohesive Cores: Identification of Core-Periphery Structures in Link Communities
地址: http://arxiv.org/abs/1810.10497
作者: Frank Havemann, Jochen Gläser, Michael Heinz
摘要: 网络中的社区通常被认为是高度紧密的子图,它们与网络的其他部分很好地分开。然而,内聚和分离通常不能同时最大化,这就是为什么通过某些方法寻求折衷的原因。当折衷不适合于要解决的问题时,将两个标准分开可能是有利的。在本文中,我们通过定义社区以及分离的子图来探索这种方法,这些子图可以具有由外围包围的一个或多个内聚核心。我们将这个想法应用于链接社区,并提出一种算法,用于构建链接社区中的分层核心 - 边结构和第一个测试结果。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。