- 用于测量和分析住宅隔离的空间接近和连接(SPC)方法;
- 在众包中实现适应性计划的预算最优化;
- 流行主题传播速度更快:在线社交网络中影响传播的新维度;
- 检测和监测食源性疾病暴发:Twitter通讯和2015年美国沙门氏菌爆发与进口黄瓜相关;
- 基于模型的社会网络聚类方法;
- 基于社会网络聚类的基于团队的方法;
- 错误和功能。对Smaldino等人的回复;
- 依赖于选区的现实;
- 二次平均场比赛;
- 最大群集网络的松弛动力学;
- 与手机数据的同伴关系:最好的朋友和家庭组成;
- 研究多层网络中特征向量多中心的一般框架;
用于测量和分析住宅隔离的空间接近和连接(SPC)方法
地址: http://arxiv.org/abs/1509.03678
作者: Elizabeth Roberto
摘要: 近年来,越来越多的人们越来越重视住宅隔离的空间尺度,如隔离区的空间布局以及分隔区的地理规模或相对规模。然而,用于测量隔离的方法不包括建筑环境的特征,例如位置之间的道路连通性或划分群体的物理障碍。本文介绍了用于测量和分析隔离的空间接近和连接(SPC)方法。 SPC方法通过考虑建筑环境的物理结构如何影响位置的邻近度和连通性来解决当前方法的局限性。在这篇文章中,我描述了更广泛地研究隔离和空间不平等的方法及其应用。我展示了一个这样的应用程序 - 分析物理障碍对住宅隔离的影响 - 以宾夕法尼亚州匹兹堡的种族隔离为例,以及对种族隔离的实证分析。 SPC方法通过捕获一个重要但不合理的隔离机制(位置之间的连通性或物理障碍)对分离的水平和空间格局的影响,从而有助于获得住房隔离的奖学金,并且能够进一步考虑到在隔离过程中建立环境。
在众包中实现适应性计划的预算最优化
地址: http://arxiv.org/abs/1602.03481
作者: Ashish Khetan, Sewoong Oh
摘要: 众包源平台提供任务请求者可以支付的市场,以获取其数据的标签。近来,这些市场已经成为收集在各种应用中训练机器学习模型至关重要的注释的热门场所。然而,由于工作繁琐,付款低,所以这种众包标签的错误很常见。在答案中克服这种噪音的一个常见策略是通过为每个任务获得多个答案并使用诸如多数投票等方法进行聚合来增加冗余。对于这样一个系统,有一个根本性的兴趣问题:如果我们可以通过固定预算来最大限度地提高准确度,就可以在众包体系中收集多少回复。我们描述了预算之间的基本权衡(请求者可以收集多少答案)和估计标签的准确性。特别地,我们询问适应性任务分配方案是否导致准确性与预算之间的更有效的权衡。基于迄今为止收集的数据自适应分配任务的自适应方案被广泛用于实际的众包体系中,以有效地使用给定的固定预算。然而,众包体系的现有理论分析表明,适应性任务分配的增益是最小的。为了弥补这一差距,我们在一个严格更为一般的概率模型下研究了这个问题,该模型最近被引入到模拟实际的众包注释。在这个广义的Dawid-Skene模型下,我们描述了预算和准确性之间的基本权衡。我们引入一个匹配这个基本限制的新颖的自适应方案。我们进一步量化自适应和非自适应方案之间的基本差距,通过将权衡与非适应性方案进行比较。我们的分析证实差距很大。
流行主题传播速度更快:在线社交网络中影响传播的新维度
地址: http://arxiv.org/abs/1702.01844
作者: Tianyi Pan, Alan Kuhnle, Xiang Li, My T. Thai
摘要: 信息可以在线上社交网络(OSN)用户中高速传播,这使OSN成为病毒式营销的重要平台。虽然过去十年来,OSNs的病毒性营销相关问题已经得到广泛的研究,但是现有的作品都是以已知的传播速度来表示的,而且当流行主题的速率可以动态增加时,不能解决这种情况。在本文中,我们提出了一种新的模型,动态影响传播(DIP),其允许传播速率在扩散期间改变,并且可以更实际地用于描述OSN中的信息传播。基于DIP,我们定义了一个新的研究问题:DIP(TAP-DIP)下的阈值激活问题。 TAP-DIP比TAP更广泛,可用于研究DIP模型。但是,它比已经存在的P#硬TAP问题增加了另一层复杂性。尽管有硬度,我们可以用$ O(\ log | V |)$比例来估计TAP-DIP。我们的解决方案包括两个主要部分:1)Lipschitz优化技术和2)一般版本的TAP的一个新的解决方案,多TAP问题。我们实验测试我们的解决方案使用各种真实的OSN数据集,并表明我们的解决方案不仅在了解速率增加时生成高质量而且更小的种子集,而且还具有可扩展性。此外,考虑到DIP与种子集选择有显着差异。
检测和监测食源性疾病暴发:Twitter通讯和2015年美国沙门氏菌爆发与进口黄瓜相关
地址: http://arxiv.org/abs/1708.07534
作者: Yuliya V. Bolotova, Jie Lou, Ilya Safro
摘要: 该研究使用Twitter作为社交媒体设备,跟踪与墨西哥进口黄瓜中与沙门氏菌相关的2015年美国食源性疾病暴发相关通信。根据疾病预防控制中心(CDC)正式公布的时间表,分析相关的Twitter数据。最大数量的注册推文与CDC首次公布之后的时期相关联,并正式发布首次召回黄瓜。
基于模型的社会网络聚类方法
地址: http://arxiv.org/abs/1708.07604
作者: Guang Ouyang, Dipak K. Dey, Panpan Zhang
摘要: 本文提出了一种基于模型的社会网络聚类方法。更准确地说,我们将社会网络中的一组实体集中在一个新采用的距离函数中的不相交的社区中。我们的模型不仅允许每个实体的混合成员资格,而且还为网络结构提供可靠的统计推断。我们设计一个基于贝叶斯的算法,即吉布斯抽样,以估计隶属度参数。我们通过将我们的模型应用于两个社交网络数据,Zachary俱乐部数据和宽吻海豚网络数据来评估我们的算法的性能。最后简要讨论一些结语和未来工作。
基于社会网络聚类的基于团队的方法
地址: http://arxiv.org/abs/1708.07609
作者: Guang Ouyang, Dipak K. Dey, Panpan Zhang
摘要: 在本文中,我们开发了一些基于团体的社交网络聚类方法。聚类结果的质量通过新颖的基于群体的指数来衡量,该指数是从[Newman 2006]中提出的模块化指数创新的。我们设计一种基于递归二分法的有效算法,以便最大限度地提高索引的目标函数。注意,当网络大小或参数空间大时,目标函数的优化是NP-hard,我们通过隐式重新启动的Lanczos方法从数字代数中放宽问题。我们的方法之一是,聚类结果中每个社区的建议索引高于预定义的阈值$ p $,完全由用户控制。然而,当阈值未知或未给出时,我们实现了一种基于树的策略,并提出了一种局部聚类算法,其考虑每个子网络的局部阈值以最大化最终聚类结果的总体评分。最后,我们利用基于随机块模型的仿真实验,以数字和图方式来演示算法的准确性和有效性。
错误和功能。对Smaldino等人的回复
地址: http://arxiv.org/abs/1708.07720
作者: Alberto Acerbi, Edwin J. C. van Leeuwen
摘要: 我们在这里提供了一个答复:Smaldino,P.E.,Aplin,L.M。&Farine D.R.,Sigmoidal Acquisition Curves Indicate Conformity? bioRxiv 159038(2017)。 https://doi.org/10.1101/159038
依赖于选区的现实
地址: http://arxiv.org/abs/1708.07722
作者: Xinying Chen, Carlos Gómez-Rodríguez, Ramon Ferrer-i-Cancho
摘要: Nelson等(2017),“美国国家科学院院报”114(18),E3669-E3678中关于“句子结构建设在语句处理过程中的神经生理动力学”的评论。
二次平均场比赛
地址: http://arxiv.org/abs/1708.07730
作者: Denis Ullmo, Igor Swiecicki, Thierry Gobron
摘要: J-M独立引进平均场比赛。 Lasry和P-L。狮子会,以及M. Huang,R.P.Marham,e和P.E.Caines,以便为大量互动代理人提出一种新的优化问题的方法。这些模型的描述分为两部分,一部分描述了参与空间中玩家密度的演变,另一个描述了每个玩家尝试最小化的成本功能的价值,预测其他玩家的理性行为。我们在这里考虑一类这样的模型,其中每个玩家的动态由Langevin Equation控制,成本函数在控制参数中是二次的。在这种情况下,与假想时间的非线性薛定er方程存在着深刻的关系,接下来,我们将描述这种关系,并展示如何导致有效的近似方案以及更好地理解行为平均野外比赛
最大群集网络的松弛动力学
地址: http://arxiv.org/abs/1708.07739
作者: Janis Klaise, Samuel Johnson
摘要: 我们研究了两种不同边动力学下完全聚类网络(最大三角形数)的松弛动力学 - 非边状态 - 双边交换,对应于配置模型的保守度随机化,单边替换,对应完全随机化的Erd \ H {o} s-R 'enyi随机图。我们得出了度数分布,边多重分布和聚类系数的时间演化的表达式。我们表明,在两个动力学网络下都经历连续的相变,其中形成了一个巨大的连接分量。我们使用Erd \ H {o} s-R 'enyi现象学来分析相位的位置。
与手机数据的同伴关系:最好的朋友和家庭组成
地址: http://arxiv.org/abs/1708.07759
作者: Tamas David-Barrett, Anna Rotkirch, Asim Ghosh, Kunal Bhattacharya, Daniel Monsivais, Isabel Behncke, Janos Kertesz, Kimmo Kaski
摘要: 以前尝试调查友谊在不同生活阶段的作用的变化,由于缺乏数据而失败。我们通过使用2007年来自欧洲国家的大量移动电话数据来缩小这一差距,研究人们的呼叫模式如何与其密切的社会接触与呼叫者的年龄和性别相关联。我们假设(i)定义为类似年龄的呼叫者的同龄人的沟通在家庭成立期间将是最重要的,并且(ii)定义为完全相同年龄的同性恋呼叫者的最佳朋友的重要性将会女性比男性要强。结果显示,与这个人口同龄同龄人的电话频率在男女生活中相对稳定。根据第一个假设,30至40岁之间的呼叫者的电话长度显着增加。部分与第二个假设相一致,尽管电话频率只有较小的性别差异,但电话的增加在女性中尤其明显。此外,女性往往与同龄女性朋友长时间进行电话交谈,也与老年同龄人交往。总而言之,我们提供大数据的证据,说明同龄人最重要的成人生活阶段,并表明最好的朋友似乎在自己的人际社会中有一个利基。
研究多层网络中特征向量多中心的一般框架
地址: http://arxiv.org/abs/1708.07763
作者: Mincheng Wu, Yongtao Zhang, Shibo He, Jiming Chen, Youxian Sun, Yang-Yu Liu
摘要: 近来网络科学界多层网络引起了广泛的关注。投入巨资努力了解其结构和功能,其中中心性是最有效的方法之一。虽然已经提出了单层网络的各种中心性度量,但是缺乏在多人网络中研究中心性的一般框架。这里我们介绍一个数学框架来研究特征向量多中心,这使我们能够量化层间影响与特征向量多中心之间的关系,提供了一种分析工具来描述节点在不同层间传播的特征向量多中心。此外,该框架是灵活的,用于集成层之间的相互作用的先前知识,以便获得针对不同场景的定制的特征向量多中心。我们展示如何通过选择适当的影响权重函数和设计算法来模拟多层影响,以计算各种典型场景中的特征向量多中心性。我们应用这个框架来分析几个经验多层网络,发现它可以量化层间的影响,并且很好地描述多层网络的结构 - 功能关系。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客 https://www.complexly.me 进行更新,并提供RSS订阅。