- 基于交互活动时间强规则性的用户会话识别;
- 网络收缩估计;
- 时间交互网络中动态嵌入轨迹的预测;
- 基于ECG数据的递归网络的双模态和尺度;
- 图神经网络的一般黑盒攻击方法;
- 具有未知参数的共识动力学的网络推断;
- 有效灾害管理推文分类与救援调度的深度学习方法;
- 将结构性耻辱纳入网络分析;
- ESA的航行2050教育和公众参与长期计划:白皮书;
- 通过图偏差时间点过程建模事件传播;
- 使用网络科学描述复杂的医疗保健系统:紧急手术的小世界;
- IPL团队形成的创新排名策略;
基于交互活动时间强规则性的用户会话识别
原文标题: User Session Identification Based on Strong Regularities in Inter-activity Time
地址: http://arxiv.org/abs/1411.2878
作者: Aaron Halfaker, Os Keyes, Daniel Kluver, Jacob Thebault-Spieker, Tien Nguyen, Kenneth Shores, Anuradha Uduwage, Morten Warncke-Wang
摘要: 会话识别是一种常用策略,用于为面向用户的系统的Web分析和行为分析开发指标。过去的工作认为,基于不活动阈值的会话识别策略本质上是任意的,或者主张将阈值设置为大约30分钟。在这项工作中,我们展示了在线活动的几个不同领域(包括视频博弈,搜索,页面浏览和志愿者贡献)的用户发起事件的时间节奏的强烈规律性。我们描述了一种用于识别用户活动集群的方法,并且认为这些活动集群出现的规律性意味着大约1小时的良好经验法则不活动阈值。最后,根据我们对目标导向的人类活动的观察和理论,这些时间节律可能对系统设计产生影响。
网络收缩估计
原文标题: Network Shrinkage Estimation
地址: http://arxiv.org/abs/1908.01087
作者: Nesreen K. Ahmed, Nick Duffield
摘要: 网络是跨越科学的复杂系统的自然表示,而高阶依赖性对于理解和建模这些系统至关重要。然而,在诸如在线社会网络的许多实际应用中,网络是大规模的,动态的和自然流动的,其中成对的交互以某种任意顺序一次一个地变得可用。这些网络的大规模和流媒体特性只允许部分观察,因为分析整个网络是不可行的。在这种情况下,研究流媒体网络的高阶结构和连接模式具有挑战性。在这项工作中,我们考虑使用自适应采样估计高阶依赖性的基本问题。我们提出了一种新颖的自适应单通道采样框架和无偏估计器,用于大流媒体网络的高阶网络分析。我们的算法利用自适应技术来识别具有高信息量的边,以便从小样本数据中有效地估计流网络的高阶结构。我们还介绍了一种新颖的James-Stein型收缩估计器,以最大限度地减少估计误差。我们的方法是完全分析的,具有理论保证,计算效率高,并且可以在流设置中逐步更新。大型网络的数值实验表明,我们的方法优于基线方法。
时间交互网络中动态嵌入轨迹的预测
原文标题: Predicting Dynamic Embedding Trajectory in Temporal Interaction Networks
地址: http://arxiv.org/abs/1908.01207
作者: Srijan Kumar, Xikun Zhang, Jure Leskovec
摘要: 在电子商务,社会网络和教育等领域,对用户和项目/产品之间的顺序交互建模至关重要。表示学习提供了一个有吸引力的机会来模拟用户和项目的动态演变,其中每个用户/项目可以嵌入欧几里得空间,并且其演化可以通过该空间中的嵌入轨迹来建模。然而,现有的动态嵌入方法仅在用户采取动作时生成嵌入,并且不在嵌入空间中明确地模拟用户/项的未来轨迹。在这里,我们提出JODIE,一个耦合的递归神经网络模型,学习用户和项目的嵌入轨迹。 JODIE使用两个递归神经网络来更新每次交互时用户和项目的嵌入。至关重要的是,JODIE还模拟了用户/项目的未来嵌入轨迹。为此,它引入了一种新颖的投影算子,学习在未来的任何时间估计用户的嵌入。然后使用这些估计的嵌入来预测未来的用户 - 项目交互。为了使方法可扩展,我们开发了一种t-Batch算法,可以创建时间一致的批次,并使培训速度提高9倍。我们进行了六次实验,以使用四个真实数据集验证JODIE对两个预测任务 - 未来交互预测和状态变化预测。我们表明,JODIE在这些任务中的表现优于六种最先进的算法,至少20%用于预测未来的相互作用,12%用于状态变化预测。
基于ECG数据的递归网络的双模态和尺度
原文标题: Bimodality and Scaling in Recurrence Networks from ECG data
地址: http://arxiv.org/abs/1908.01286
作者: Sneha Kachhara, G. Ambika
摘要: 人类心脏是一个复杂的系统,可以使用其记录为心电图(ECG)的电活动进行研究。 ECG中的任何变化或异常都可以指示心脏动力学的异常。在这项工作中,我们使用递归网络(RN)框架提供心电数据的详细分析。我们展示了如何根据ECG数据集构建的递归网络的度量,可以量化数据的复杂性和可变性。我们的研究首次表明心电图中的RN显示其双度分布的独特特征。我们将此与心脏系统的复杂动力学联系起来,其结构处于两个空间尺度。我们还表明,从具有递归阈值的度量的尺度中提取相关信息。因此,我们在ECG数据的链路密度中观察到两个尺度区域,其与来自标准混沌和超混沌系统和噪声的RN中的尺度进行比较。虽然双峰性和尺度是来自所有类型的ECG数据的RN的共同特征,但我们发现它们中的疾病特定变化可以量化。
图神经网络的一般黑盒攻击方法
原文标题: The General Black-box Attack Method for Graph Neural Networks
地址: http://arxiv.org/abs/1908.01297
作者: Heng Chang, Yu Rong, Tingyang Xu, Wenbing Huang, Honglei Zhang, Peng Cui, Wenwu Zhu, Junzhou Huang
摘要: 随着图神经网络(GNNs)在图结构数据上表示学习的巨大成功,GNN对抗对抗性攻击的鲁棒性不可避免地成为图学习领域的核心问题。无论取得多大进展,目前的工作都受到两个主要局限:第一,需要逐案开发的攻击方法;其次,大多数都局限于白盒攻击。本文以更一般和灵活的意义推广当前框架 - 我们只需要一种方法来攻击各种类型的GNN,而这种攻击者是黑盒驱动的。为此,我们首先以原则的方式研究不同类型的GNN之间的理论联系,并将不同的GNN模型集成到一个统一的框架中,称为通用谱图卷积。因此,针对两个GNN族提出了广义对抗攻击者:基于卷积的模型和基于抽样的模型。更有趣的是,我们的攻击者不需要了解GNN中使用的目标分类器。广泛的实验结果验证了我们的方法在几个基准数据集上的有效性。特别是通过使用我们的攻击,即使像单边翻转这样的小图扰动也能够始终如一地对不同的GNN模型进行强大的性能攻击。
具有未知参数的共识动力学的网络推断
原文标题: Network Inference from Consensus Dynamics with Unknown Parameters
地址: http://arxiv.org/abs/1908.01393
作者: Yu Zhu, Michael T. Schaub, Ali Jadbabaie, Santiago Segarra
摘要: 我们从网络上发生的参数不确定性的单个或多个离散时间共识动力学的快照中探索推断加权无向网络的图拉普拉斯算子的问题。具体而言,我们考虑三个问题,其中我们假设关于扩散速率,观察时间和动态的输入信号功率的不同知识水平。为了解决这些欠定问题,我们提出了一套算法,利用观测数据的谱特性和凸优化的工具。此外,我们提供与这些算法相关的理论性能保证。我们通过数值实验补充了我们的理论工作,证明了我们提出的方法如何优于当前最先进的算法,并展示了它们在恢复合成和现实网络方面的有效性。
有效灾害管理推文分类与救援调度的深度学习方法
原文标题: A Deep Learning Approach for Tweet Classification and Rescue Scheduling for Effective Disaster Management
地址: http://arxiv.org/abs/1908.01456
作者: Md. Yasin Kabir, Sanjay Madria
摘要: 以及时的方式从受灾地区的不同地区获取信息是一项具有挑战性和复杂的任务。社交媒体和网络的广泛传播和覆盖范围允许人们实时共享信息。然而,社交媒体数据的处理和有价值信息的收集需要一系列操作,例如(1)处理文本分类的每个特定推文,(2)基于推文的需要帮助的人的可能位置确定,以及(3)基于推文分类的救援任务优先级计算。这是使用社交媒体数据开发有效救援调度操作的三个主要挑战。在本文中,首先,我们提出了一种深度学习模型,结合了基于注意力的双向长期短期记忆(BLSTM)和卷积神经网络(CNN)来对不同类别的推文进行分类。我们使用预先训练的危机词向量和用于词表示的全局向量(GLoVe)来从推文中捕获语义。接下来,我们执行特征工程以创建辅助特征图,从而显著提高模型精度。在我们使用来自Hurricanes Harvey和Irma的真实数据集的实验中,观察到我们提出的方法与基于Precision,Recall,F1-score和Accuracy的其他分类方法相比表现更好,并且非常有效地确定正确的优先级。一条推文。此外,为了评估所提出的分类模型的有效性和稳健性,合并数据集包括来自CrisisNLP的4个不同数据集,以及来自CrisisLex的另外15个不同灾害数据。最后,我们开发了一种考虑资源约束的自适应多任务混合调度算法,以针对不同的救援优先级执行有效的救援调度操作。
将结构性耻辱纳入网络分析
原文标题: Incorporating Structural Stigma into Network Analysis
地址: http://arxiv.org/abs/1908.01500
作者: Francis Lee, Carter T. Butts
摘要: 丰富的文献已经探索了在指数家庭随机图(ERGM)框架内与个体水平协变量相关的同质性和其他形式的非均匀混合的建模。然而,这种差异混合并不能完全解释诸如耻辱之类的现象,这些现象涉及通过群外关系的人的排斥来积极维持社会边界。在这里,我们引入了一个新的统计数据,可以捕获这样的效应,从而可以探测边界维护的潜在存在,超出提名率的简单差异。我们在学校教室的性别隔离背景下证明了这一统计数据。
ESA的航行2050教育和公众参与长期计划:白皮书
原文标题: ESA's Voyage 2050 Long-term Plan for Education and Public Engagement: White Paper
地址: http://arxiv.org/abs/1908.01546
作者: Pedro Russo, Łukasz Alwast, Lars Lindberg Christensen, Ewine van Dishoeck, Urban Eriksson, Edward Gomez, Jorge Rivero Gonzalez, Anita Heward, Mairéad Hurley, Veronika Liebl, Ana Noronha, Amelia Ortiz-Gil, Jan Pomierny, Stephen Pompea, Stefano Sandrelli, Oana Sandu, Simon Ings
摘要: 本白皮书回应了欧洲航天局(ESA)科学计划的“航行2050白皮书征集”,并认为教育,交流和公众参与(以下简称EPE)应优先考虑Voyage 2050规划周期。 ESA Science的Voyage 2050任务承诺深入了解我们时代的重要存在问题:宇宙中生命的盛行;空间和时间的本质;以及物质,能量和重力的相互交织的本质。收集,处理和处理大量数据集的创新很可能会在未来几十年内将这些主题推向科学成熟。它们为我们提供了一个及时的机会,强调空间科学与日常生活和思考的相关性。更一般地说,空间科学正在逐渐成熟,以至于它有助于我们文化话语的每个主要方面。公民需要信息,资源和机会积极参与该话语,ESA Science可以提供这些信息。本白皮书是一项适度的尝试,旨在支持ESA Science改善其与社会的互动。它侧重于改善ESA科学教育和公众参与活动的问题和主题。它没有详述ESA已经擅长的主题;因此,本白皮书对应该和可以改进的内容进行了严格的审查。我们相信ESA的Voyage 2050计划团队有责任代表欧洲的社会和文化多样性,我们的建议就是本着这样的精神构思:支持ESA Science的复杂任务,即在规划,建设和运营等复杂问题上吸引大量不同的受众。太空任务。
通过图偏差时间点过程建模事件传播
原文标题: Modeling Event Propagation via Graph Biased Temporal Point Process
地址: http://arxiv.org/abs/1908.01623
作者: Weichang Wu, Huanxi Liu, Xiaohu Zhang, Yu Liu, Hongyuan Zha
摘要: 时间点过程广泛用于顺序数据建模。在本文中,我们关注图中顺序事件传播的建模问题,例如社会网络用户的转发,网站之间的新闻传输等。鉴于事件传播序列的集合,传统的点过程模型仅考虑事件历史,即将事件历史嵌入到矢量中,而不是潜在的图结构中。我们提出了一种图偏差时间点过程(GBTPP),它利用来自图表示学习的结构信息,其中节点之间的直接影响和事件历史的间接影响分别被建模。此外,学习节点嵌入向量也作为辅助信息被集成到嵌入事件历史中。在合成数据集和两个真实世界数据集上的实验显示了我们的模型与传统方法和现有技术相比的功效。
使用网络科学描述复杂的医疗保健系统:紧急手术的小世界
原文标题: Characterising complex healthcare systems using network science: The small world of emergency surgery
地址: http://arxiv.org/abs/1908.01688
作者: Katharina Kohler, Ari Ercole
摘要: 医院是复杂的系统,优化其功能对于提供高质量,高性价比的医疗保健至关重要。尽管如此,性能指标迄今仍集中在各个元素的性能上,而不是整个系统的性能上。在不对其功能进行综合理解的情况下操纵复杂系统的各个元素是不可取的,并且可能导致反直觉的结果,并且医院功能的整体度量可能有助于设计更有效的服务。我们的目的是使用网络分析来描述我们三级医院的急诊手术入院围手术期护理系统。我们使用回顾性电子健康记录数据来构建系统的加权有向网络。为此,我们选择了在住院期间进行外科手术干预的3。5年期间的所有计划外入院,并获得了16,500份个人住院病例。然后,我们使用网络科学的既定方法构建和分析了该网络的结构,如度分布,中介中心性和小世界特征。分析表明,该服务是一个复杂的系统,具有无标度,小世界的网络属性。该发现对于服务的结构和弹性具有影响,因为这样的网络虽然通常是健壮的,但可能容易受到特定关键节点的中断的影响。我们还根据各种网络措施确定了系统中潜在的中心和瓶颈。希望对医院服务进行全面的系统范围描述可以为医院应变提供更好的指标,并有助于规划人员设计尽可能强大的外部冲击系统。
IPL团队形成的创新排名策略
原文标题: Innovative ranking strategy for IPL team formation
地址: http://arxiv.org/abs/1908.01725
作者: Saptarshi Banerjee, Arnabi Mitra, Debayan Ganguly, Ritajit Majumdar, Kingshuk Chatterjee
摘要: 印度超级联赛(IPL)是一场20场板球比赛。这场比赛的队伍是通过一组球员的拍卖选出的。每个团队都聘请智囊团来建立最好的团队。很少有研究使团队选择过程自动化。然而,这些研究主要集中在当前的球员形式或长期表现上。在本文中,我们(i)选择了传统特征,并确定了一些衍生特征,这些特征是由传统特征产生的,用于击球手和保龄球手,(ii)用于将击球手聚集成开场者,中级击球手和终结者的公式化启发式,(iii)考虑到当前表现以及每个球员的经验,制定了击球手和保龄球运动员相对排名的启发式算法,以及(iv)提出了两种贪婪的球队选择算法,其中球队的总积分和数量为每个群集中的玩家都是固定的。我们提出的排名方案和算法不仅确定最佳可能的团队,而且如果其中一个目标玩家不可用,也可以确定最佳替代玩家。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。