Arxiv网络科学论文摘要12篇(2018-08-28)

网络中的多核心-边缘结构;
理论驱动的自杀推文自动内容分析：使用基于典型的LDA数据集分类;
在公用设施线路中断数据中发现Zipf分布和级联传播度量;
表征社交媒体用户用于讽刺检测;
时间依赖分组观测的网络推断;
当事实无效：社会网络中的偏见，两极分化和真实;
突然投票中社交媒体用户的立场：希腊公投的案例;
基于提升低秩矩阵逼近的多层网络嵌入;
用于从带干扰的实验估算全局治疗效果的回归调整;
具有恢复数据的大规模空间中的人类迁移模式;
R0无法预测存在自然增强免疫力情况下的爆发潜力;
开放心智模仿可以实现接近最佳的疫苗接种覆盖率;

网络中的多核心-边缘结构

原文标题： Multicores-periphery structure in networks

地址： http://arxiv.org/abs/1605.03286

作者： Bowen Yan, Jianxi Luo

摘要：许多现实世界的网络呈现出多核外围结构，在多个核心中具有密集连接的顶点，由稀疏连接的顶点的一般外围围绕。识别多核 - 外围结构可以提供新的透镜来理解各种现实世界网络的结构和功能。本文定义了多核外围结构，并介绍了一种算法，用于识别一般网络中多核和外围的最佳划分。我们通过将其应用于众所周知的社会网络和专利技术网络来证明我们的算法的性能，其最佳特征在于多核 - 外围结构。分析还揭示了我们的多核 - 外围检测算法与用于检测单核 - 外围结构和群落结构的两种最先进算法之间的差异。

理论驱动的自杀推文自动内容分析：使用基于典型的LDA数据集分类

原文标题： Theory-Driven Automated Content Analysis of Suicidal Tweets : Using Typicality-Based Classification for LDA Dataset

地址： http://arxiv.org/abs/1808.08331

作者： Joon-Mo Park, Chul-joo Lee, Yunseok Jang

摘要：本研究为计算机根据计划行为理论的变量对推文进行分类提供了一种方法框架。我们提出了一个自动文本分析的顺序过程，它结合了监督方法和无监督方法，以使计算机检测每个推文中的一个TPB变量。我们进行了潜在Dirichlet分配（LDA），最近邻，然后评估新标记的推文的“典型性”，以预测分类边界。此外，这项研究报告了自杀相关推文的内容分析结果，该推文识别了Twitter中信息环境的特征。与现存的关于自杀报道的文献一致，调查结果表明，推文通常包含的信息可以促使人们对自杀行为进行控制，但很少提供有关自杀的信息。最后，我们强调了对方法学进步和经验理论研究的启示。

在公用设施线路中断数据中发现Zipf分布和级联传播度量

原文标题： Finding a Zipf distribution and cascading propagation metric in utility line outage data

地址： http://arxiv.org/abs/1808.08434

作者： Ian Dobson

摘要：观察到的传输线中断数据被分组为连续的几代事件。级联中的世代数的经验分布遵循Zipf分布，其意味着随着级联的进展而增加的传播。 Zipf分布的斜率给出系统事件传播斜率指数（SEPSI）。该新指标量化级联传播，按预期变化，并确定小，中和大级联的概率。

表征社交媒体用户用于讽刺检测

原文标题： Representing Social Media Users for Sarcasm Detection

地址： http://arxiv.org/abs/1808.08470

作者： Y. Alex Kolchinski, Christopher Potts

摘要：我们探索了两种在文本讽刺检测环境中表示作者的方法：贝叶斯方法直接表示作者的讽刺倾向，以及密集的嵌入方法，可以学习作者和文本之间的相互作用。使用Reddit注释的SARC数据集，我们表明用这些表示来增强双向RNN可以提高性能;贝叶斯方法在均匀上下文中就足够了，而密集嵌入的附加功率在更多样化的方面证明是有价值的。

时间依赖分组观测的网络推断

原文标题： Network Inference from Temporal-Dependent Grouped Observations

地址： http://arxiv.org/abs/1808.08478

作者： Yunpeng Zhao

摘要：在社会网络分析中，观察到的数据通常是一些社会行为，例如群体的形成，而不是明确的网络结构。 Zhao和Weko（2017）提出了一种基于模型的方法，称为中心模型，用于从分组观察中推断隐式网络。中心模型假定组之间的独立性，有时在实践中无效。在本文中，我们将中心模型的概念概括为具有时间依赖性的分组观测的情况。与中心模型一样，我们假设每个时间点的组由一个领导者收集。与中心模型不同，组长不是独立采样，而是遵循马尔可夫链，相邻组中的其他成员也可以相关。针对该模型开发了期望最大化（EM）算法，并且针对E步骤提出了多项式时间算法。在不同的模拟设置下评估新模型的性能。我们将此模型应用于Kibale Chimpanzee项目的数据集。

当事实无效：社会网络中的偏见，两极分化和真实

原文标题： When facts fail: Bias, polarisation and truth in social networks

地址： http://arxiv.org/abs/1808.08524

作者： Orowa Sikder, Robert E. Smith, Pierpaolo Vivo, Giacomo Livan

摘要：在线社交媒体为用户提供了前所未有的机会来参与各种意见。同时，它们允许个人通过主动（确认偏见）和被动（个性化新闻算法）自我强化机制自我选择他们想要接触的叙述来传播错误信息。对这种权衡的精确理论理解仍然在很大程度上缺失。我们引入了一个程式化的社交学习模型，网络中的大多数参与者基于新信息的到来，无偏见地更新他们的信念，而一小部分参与者显示确认偏差，使他们能够拒绝与其先前存在的信念不一致的新闻。我们表明，这种简单的确认偏差机制可以产生永久的意见极化。此外，该模型导致无偏见的代理人表现出“好像”他们有偏见的状态，因为他们的偏见邻居有效地充当了看门人，限制了他们获取自由和多样化的信息。我们得出了个体代理人信念分布的分析结果，明确地证明了上述在确认偏差和社会连通性之间的权衡，我们进一步验证了美国县级数据，即互联网接入对全球信仰形成的影响。变暖。我们的研究结果表明，通过保留社会网络中的信息多样性，小剂量的确认偏差实际上可以提高个体的准确性。然而，结果还表明，当确认偏差超过最佳值时，准确度会下降，因为有偏见的代理人会限制信息流向子组。我们讨论了模型的政策含义，突出了揭穿策略的缺点，并提出了对比错误信息的替代策略。

突然投票中社交媒体用户的立场：希腊公投的案例

原文标题： Nowcasting the Stance of Social Media Users in a Sudden Vote: The Case of the Greek Referendum

地址： http://arxiv.org/abs/1808.08538

作者： Adam Tsakalidis, Nikolaos Aletras, Alexandra I. Cristea, Maria Liakata

摘要：在社交媒体中对用户投票意图进行建模是一个重要的研究领域，应用于分析选民行为，在线政治竞选和广告。以前的方法主要侧重于预测全国大选，这些大选是定期安排的，并且可以获得过去结果和民意调查的数据。但是，没有证据表明在时间紧迫的情况下突然投票期间这些模型将如何表现。与传统选举相比，这带来了更具挑战性的任务，因为它具有自发性。在本文中，我们关注2015年希腊救助公投，旨在每天预测2,197名Twitter用户的投票意向。我们提出了一种半监督的多卷积核学习方法，利用时间敏感的文本和网络信息。我们在实时仿真框架下的评估证明了我们的方法对竞争基线的有效性和稳健性，与仅基于文本的模型相比，F分数显著增加了20％。

基于提升低秩矩阵逼近的多层网络嵌入

原文标题： Multi-Level Network Embedding with Boosted Low-Rank Matrix Approximation

地址： http://arxiv.org/abs/1808.08627

作者： Jundong Li, Liang Wu, Huan Liu

摘要：与手动特征工程相比，繁琐且难以扩展，网络表示学习吸引了大量研究兴趣，因为它自动化了图上的特征学习过程。所学习的低维节点向量表示是可推广的，并且通过使得能够直接应用各种现成的机器学习工具来简化图上的知识发现过程。最近的研究表明，过去十年的网络嵌入方法要么明确地分解精心设计的矩阵以获得低维节点向量表示，要么与隐式矩阵分解密切相关，其基本假设是分解节点连接矩阵低 - 秩。尽管如此，当分解矩阵对复杂节点交互进行编码时，全局低秩假设不一定成立，并且所得到的单个低秩嵌入矩阵不足以捕获所有观察到的连接模式。在这方面，我们提出了一种新颖的多级网络嵌入框架BoostNE，它可以学习从粗到细的不同粒度的多个网络嵌入表示，而不会强加普遍的全局低秩假设。所提出的BoostNE方法也与集成学习中成功的梯度增强方法一致，因为多个弱嵌入导致更强和更有效的嵌入。我们通过将其与各种数据集上现有的最先进的网络嵌入方法进行比较来评估所提出的BoostNE框架的有效性，并且实验结果证实了所提出的BoostNE网络嵌入框架的优越性。

用于从带干扰的实验估算全局治疗效果的回归调整

原文标题： Regression Adjustments for Estimating the Global Treatment Effect in Experiments with Interference

地址： http://arxiv.org/abs/1808.08683

作者： Alex Chin

摘要：在存在干扰的情况下，全球平均治疗效果的标准估计可能存在偏差。本文提出了回归调整估计器，用于消除伯努利随机实验中由于干扰引起的偏差。我们使用拟合模型来预测全球控制和全球治疗的反事实结果。我们的工作与标准回归调整的不同之处在于调整变量是根据治疗分配向量的函数构建的，我们允许研究人员使用与响应相关的任何函数的集合，将检测干扰的问题转化为特征工程问题。我们在线性模型设置中表征所提出的估计器的分布，并将结果与SUTVA下的回归调整的标准理论联系起来。然后，我们提出了一种估计器，允许灵活的机器学习估计器用于拟合非线性干涉函数形式，借鉴双机学习文献中的思路。我们建议通过自举和重采样方法进行统计推断，这使我们能够回避干扰所隐含的复杂依赖性，而是依赖于经验协方差结构。这种方差估计依赖于外生假设，类似于观察研究中引用的标准无混淆假设。在模拟实验中，我们的方法比基于邻域暴露建模的现有反向倾向加权估计更好地进行偏差估计。我们用我们的方法重新分析了一项关于中国农村一系列村庄采用天气保险的实验。

具有恢复数据的大规模空间中的人类迁移模式

原文标题： Human migration patterns in large scale spatial with the resume data

地址： http://arxiv.org/abs/1808.08741

作者： Qi Nie, Jian-Jun Wu, Xiao-Yong Yan, Jin-Hu Liu, Jun Wang

摘要：人类流动性研究在很多方面都取得了很大进展，但由于难以获取家庭数据，长期和远程迁移行为缺乏深入而广泛的研究。在本文中，我们使用简历数据来发现大规模范围内的人类迁移行为。研究发现，反映人口竞争影响的流动结构的不对称性是由城市间的吸引力差异引起的。该流动结构可以通过空间经济学的引力模型近似描述。此外，引力模型中距离函数的比例指数值小于短期旅行行为的值。这意味着，与短期旅行行为相比，长期的人类迁移行为不那么敏感。此外，研究了引力模型中每个变量的尺度系数。结果表明，经济水平是移民的主要因素。

R0无法预测存在自然增强免疫力情况下的爆发潜力

原文标题： fails to predict the outbreak potential in the presence of natural-boosting immunity

地址： http://arxiv.org/abs/1808.08749

作者： Yukihiko Nakata, Ryosuke Omori

摘要：由于减弱和增强免疫力，宿主在个体水平上随时间变化的易感性已经引起疾病传播动力学的丰富的长期行为。同时，尽管大量可用的流行病学数据是短期流行病，但主观易感性的时变异质性对流行病的射击期行为的影响尚未得到充分研究。在这里，我们构建了一个简约的数学模型，描述短期传递动力学，考虑到通过再感染提高自然增强免疫力，并获得了我们模型的显式解决方案。我们发现我们的系统显示“流行病延迟”，流行病在流行病初始阶段流行曲线的负斜率后起飞，此外还有标准SIR模型中的常见分类，即“无流行病”为 \ mathcal {R} _ {0} \ leq1 或正常流行为 \ mathcal {R} _ {0}> 1 。使用显式解决方案，我们得出每个分类的条件。

开放心智模仿可以实现接近最佳的疫苗接种覆盖率

原文标题： Open-minded imitation can achieve near-optimal vaccination coverage

地址： http://arxiv.org/abs/1808.08789

作者： Ying Xin, David Gerberry, Winfried Just

摘要：理性个体对自愿接种决策的研究预测，人口将达到纳什均衡，疫苗接种覆盖率低于社会最优。人类决策涉及除自身利益的理性计算之外的机制，例如模仿成功的其他人。以前的研究表明，单靠模仿无法取得更好的效果。在参数的现实选择下，它可能导致平衡疫苗接种覆盖甚至低于纳什均衡。然而，这些发现依赖于广泛接受的Fermi函数用于模拟转换到另一策略的概率。我们在这里考虑切换概率的更一般的功能形式。它与在广泛引用的心理学实验中最符合经验数据的函数一致，并涉及一个额外的参数 \ alpha 。这个参数可以被宽泛地解释为一种开放的程度。我们通过模拟和分析发现，足够高的 \ alpha 值将使平衡疫苗接种覆盖率任意接近社会最优。

声明：Arxiv文章摘要版权归论文原作者所有，由本人进行翻译整理，未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”（微信号netsci）和个人博客 https://www.complexly.me （提供RSS订阅）进行同步更新。