- 使用地理标记推文/土地使用数据和dasymetric地图估算城市地区高时空分辨率的每小时人口分布变化;
- 网络分布式优化的推拉梯度法;
- 支持还是不支持Kavanaugh:这是个极化问题;
- SINE:可扩展的不完整网络嵌入;
- 在二部图中寻找密集子图:线性算法及其在欺诈检测中的应用;
- TNE:网络表示学习的潜在模型;
- 通过搜索引擎获得意见动态;
- 网络层析:用于研究网络动态的新结构谱;
- 社会传染的单纯模型;
- 迈向社会崩溃的一般理论:复杂性收益递减的Tainter模型的生物物理分析;
- 粒子速度控制传染动力学中的相变;
使用地理标记推文/土地使用数据和dasymetric地图估算城市地区高时空分辨率的每小时人口分布变化
原文标题: Estimating hourly population distribution change at high spatiotemporal resolution in urban areas using geo-tagged tweets, land use data, and dasymetric maps
地址: http://arxiv.org/abs/1810.06554
作者: Ming-Hsiang Tsoua, Hao Zhanga, Atsushi Naraa, Su Yeon Han
摘要: 本文介绍了一种时空分析框架,用于使用地理标记的推文(包含用户物理位置的消息),土地使用数据和dasymetric地图估算城市地区每小时人口分布变化。我们使用Twitter的流媒体应用程序编程接口(API)在一年(2015年)内收集了圣地亚哥县内的地理标记社交媒体(推特)。用于数据清理的半手动Twitter内容验证程序首先应用于分离由人类和非人类用户(机器人)创建的推文。下一步是使用两个不同的地理单位计算每小时唯一Twitter用户的数量:(1)人口普查区块,以及(2)LandScan的1km×1km分辨率网格。最后一步是通过将每个人口普查区块或网格中唯一的Twitter用户数量转换为具有空间和时间变化因素的估计人口密度来估计实际动态人口。时间因素基于加利福尼亚州圣地亚哥县内独特Twitter用户的每小时频率变化。通过使用土地利用图和2010年人口普查数据的dasymetric方法估算空间因子。创建了几个比较图来可视化动态人口分布的时空模式变化。
网络分布式优化的推拉梯度法
原文标题: Push-Pull Gradient Methods for Distributed Optimization in Networks
地址: http://arxiv.org/abs/1810.06653
作者: Shi Pu, Wei Shi, Jinming Xu, Angelia Nedić
摘要: 在本文中,我们专注于解决网络中的分布式凸优化问题,其中每个代理具有其自己的凸成本函数,并且目标是在遵守网络连接结构的同时最小化代理的成本函数的总和。为了最小化成本函数的总和,我们考虑新的基于分布梯度的方法,其中每个节点保持两个估计,即最优决策变量的估计和代理的目标函数的平均值的梯度估计。 。从代理的角度来看,关于决策变量的信息被推送到邻居,而关于梯度的信息被从邻居中拉出,因此给出了名称“推拉梯度方法”。该名称也是由于对实现方面的考虑:推送通信协议和拉通信协议分别用于实现数值方案中的某些步骤。这些方法利用两个不同的图表来进行代理之间的信息交换,因此,将算法与不同类型的分布式体系结构统一起来,包括分散(对等),集中(主从)和半集中(领导) -follower)架构。我们表明,在同步和异步随机八卦设置中,所提出的算法及其许多变体线性地收敛于网络上的强凸和平滑目标函数(可能具有单向数据链路)。我们在数值上评估我们提出的静态和时变图算法,并发现与其他线性收敛方案相比,算法具有竞争力。
支持还是不支持Kavanaugh:这是个极化问题
原文标题: To Kavanaugh or Not to Kavanaugh: That is the Polarizing Question
地址: http://arxiv.org/abs/1810.06687
作者: Kareem Darwish
摘要: 2018年10月6日,美国参议院以1881年以来成功确认的最小幅度确认了Brett Kavanaugh,并且参议员以压倒多数的方式投票支持党派界线。在本文中,我们研究参议院的政治两极分化是否反映在公众中。为此,我们分析了超过12.8万Twitter用户的观点。我们表明,支持或反对Kavanaugh提名的用户通常使用不同的主题标签,转发不同的Twitter帐户,以及共享来自不同网站的链接。我们还研究了两个群体的特征。
SINE:可扩展的不完整网络嵌入
原文标题: SINE: Scalable Incomplete Network Embedding
地址: http://arxiv.org/abs/1810.06768
作者: Daokun Zhang, Jie Yin, Xingquan Zhu, Chengqi Zhang
摘要: 归因网络嵌入旨在学习网络中节点的低维矢量表示,其中每个节点包含描述节点内容的丰富属性/特征。由于网络拓扑结构和节点属性通常表现出高相关性,因此将节点属性接近度并入网络嵌入有利于学习良好的向量表示。实际上,大规模网络通常具有不完整/缺失的节点内容或链接,但现有的归因网络嵌入算法都在网络完整的假设下运行。因此,它们的性能容易丢失数据并且可用性差。在本文中,我们提出了一种可扩展的不完全网络嵌入(SINE)算法,用于学习不完整图的节点表示。 SINE制定概率学习框架,该框架分别模拟节点上下文和节点属性关系的对。与现有的归因网络嵌入算法不同,SINE提供了更大的灵活性,可以充分利用有用的信息,并减少缺失信息对表示学习的负面影响。推导出基于随机梯度下降的在线算法来学习节点表示,允许SINE扩展到具有高学习效率的大规模网络。我们通过在现实世界网络上的广泛实验来评估SINE的有效性和效率。实验结果证实,在缺少链接和节点属性的设置下,SINE在各种任务(包括节点分类,节点聚类和链路预测)方面优于最先进的基线。 SINE还被证明在具有数百万个节点/边和高维节点特征的大规模网络上具有可扩展性和高效性。本文的源代码可从https://github.com/daokunzhang/SINE获得。
在二部图中寻找密集子图:线性算法及其在欺诈检测中的应用
原文标题: On Finding Dense Subgraphs in Bipartite Graphs: Linear Algorithms with Applications to Fraud Detection
地址: http://arxiv.org/abs/1810.06809
作者: Yikun Ban, Yitao Duan, Ling Huang
摘要: 从大图中检测密集子图是许多应用程序的核心组件,从社会网络挖掘,生物信息学到在线欺诈检测。在本文中,我们专注于在二部图中挖掘密集子图。这项工作的动机是欺诈检测任务,通常可以将其制定为挖掘由源节点(粉丝,客户)和目标节点(跟随者,产品等)形成的二部图,以用于恶意模式。我们引入了一个新的限制性biclique问题,Maximal Half Isolated Biclique(MHI Biclique),并表明该问题在欺诈检测中立即应用。我们证明,与许多其他的双重问题不同,例如已知为NP-Complete的最大边biclique问题,MHI Biclique问题允许线性时间解决方案。我们提供了一种新颖的算法S-tree及其扩展S-forest,可以有效地解决问题。我们还证明了算法对于故意伪装和其他扰动是强有力的。此外,我们的方法可以自动组合多个功能并确定其优先级,从而减少对功能工程的需求,同时保持安全性,防止看不见的攻击。对几个公共和专有数据集的广泛实验表明,S-tree / S-forest在所有配置中都优于强大的竞争对手,成为欺诈检测领域的新技术。
TNE:网络表示学习的潜在模型
原文标题: TNE: A Latent Model for Representation Learning on Networks
地址: http://arxiv.org/abs/1810.06917
作者: Abdulkadir Çelikkanat, Fragkiskos D. Malliaros
摘要: 网络表示学习(NRL)方法旨在通过保留给定网络的局部和全局结构将每个顶点映射到低维空间,并且近年来由于它们在几个具有挑战性的问题中的成功而受到了极大的关注。尽管已经提出了各种方法来计算节点嵌入,但是许多成功的方法受益于随机遍历以便将给定网络转换成节点序列的集合,然后它们通过预测每个顶点的上下文来学习节点的表示。序列。在本文中,我们介绍了一个通用框架来增强通过基于随机游走的方法获取的节点的嵌入。类似于NLP中主题词嵌入的概念,所提出的方法将每个顶点分配给具有各种统计模型和社区检测方法的主题的主题,然后生成增强的社区表示。我们在两个下游任务上评估我们的方法:节点分类和链路预测。实验结果表明,顶点和主题嵌入的结合优于广为人知的基线NRL方法。
通过搜索引擎获得意见动态
原文标题: Opinion Dynamics via Search Engines
地址: http://arxiv.org/abs/1810.06973
作者: Fabrizio Germano, Francesco Sobbrio
摘要: 排名算法是互联网时代的信息守门人。我们开发了一个程式化模型来研究排名算法对意见动态的影响。我们考虑使用基于流行度和个性化的算法的搜索引擎。我们发现基于流行度的排名产生效果较小的优势:报告给定信号的网站越少,总体上吸引的流量就越多。这突出了一个新颖的,排名驱动的渠道,解释了错误信息的传播,因为报告错误信息的网站可能会吸引大量的流量,因为它们很少。此外,当个人向排名算法提供足够积极的反馈时,基于流行度的排名倾向于聚合信息,而个性化则在相反的方向上行动。
网络层析:用于研究网络动态的新结构谱
原文标题: Network tomography: a new structure spectrum for studying network dynamics
地址: http://arxiv.org/abs/1810.07004
作者: Ricky X. F. Chen, Christian M. Reidys, Andrei C. Bura
摘要: 复杂网络的动态分析与网络本身的结构特征密切相关。网络特征,例如图核心和顶点度数已被证明是网络动态的判别,并且无处不在地进行研究。在这里,我们通过D-spectrum连接这些网络动态的中心判别式,D-spectrum是一种新的框架,用于识别网络中包含的嵌套子图链集合。核心和顶点度数可以从两个特定的这样的链中导出。此外,每个链产生一个顶点的等级,这些等级的集合是顶点的D-谱,提供了新的表征。我们通过节点删除算法计算这个D谱,我们引入了一个特定的图动力系统,称为M-C系统,其中D-谱出现为一个固定点。使用D-谱,我们在各种网络上识别易感传染性恢复(SIR)模型中具有相似扩散能力的节点,并表明它比基于 k -core分解的节点更可靠。此外,我们比较了通过顶点传染性获得的两种不同感染概率和D-谱的聚类,并表明它们是高度相关的。
社会传染的单纯模型
原文标题: Simplicial models of social contagion
地址: http://arxiv.org/abs/1810.07031
作者: Iacopo Iacopini, Giovanni Petri, Alain Barrat, Vito Latora
摘要: 复杂网络已成功用于描述人群之间疾病的传播。相反,成对相互作用通常不足以描述社会传染过程的特征,例如意见形成或新颖性的采用,其中同伴影响和强化机制的更复杂动态正在发挥作用。我们在这里介绍一种社会传染的高阶模型,其中社会系统由单纯的复合体代表,传染可以通过不同的传播速率,通过链接或通过不同大小的群体中的相互作用发生。合成单纯形复合物和分析结果模型的数值模拟突出了新现象的出现,例如由高阶相互作用引起的爆炸转变的出现。
迈向社会崩溃的一般理论:复杂性收益递减的Tainter模型的生物物理分析
原文标题: Toward a General Theory of Societal Collapse. A Biophysical Examination of Tainter s Model of the Diminishing Returns of Complexity
地址: http://arxiv.org/abs/1810.07056
作者: Ugo Bardi, Sara Falsini, Ilaria Perissi
摘要: 大型社会系统的崩溃,通常被称为文明或帝国,是一个众所周知的历史现象,但其起源是一个尚未解决的辩论的对象。在本文中,我们提出了一个简单的生物物理模型,我们将其与社会崩溃的概念联系起来,因为Joseph Tainter提出的复杂性收益递减。我们的模型基于社会经济系统的描述,作为能源库的营养链,消除了可用资源的能源潜力。该模型产生各种下降轨迹,在某些情况下足够快,可以定义为坍塌。与此同时,我们观察到资源存量(生产)的利用与系统的复杂性具有强烈的非线性关系,假设与称为官僚机构的股票的大小成比例。这些结果为Tainter的假设提供了支持。
粒子速度控制传染动力学中的相变
原文标题: Particle velocity controls phase transitions in contagion dynamics
地址: http://arxiv.org/abs/1810.07169
作者: Jorge P. Rodríguez, Fakhteh Ghanbarnejad, Víctor M. Eguíluz
摘要: 相互作用通常需要粒子之间的接近度。因此,粒子的运动驱动位于其附近的邻居的变化,从而导致一系列相互作用。在致病性传染中,感染通过近端相互作用发生,但同时该运动促进不同菌株的共同定位。我们分析了粒子速度如何影响单一感染和两种合作感染的传染过程的相变。首先,我们确定与最大流行阈值相关的最佳速度(约为交互范围的一半),这样将速度降低到最佳值以下会导致更大的爆发。其次,在合作的情况下,系统显示低速度的连续过渡,其对于相互作用范围的两倍量级的速度变得不连续。最后,我们描述了这些特征体系并解释了驱动动力学的机制。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。