- 音调和声与动态乐谱网络拓扑;
- 紧密协作网络模型;
- REFORM:更换子团队的快速,自适应解决方案;
- 探索用于社交媒体中仇恨言语和攻击性言语识别的transformer模型的多任务多语言学习;
- 小世界网络:综述和属性分析;
- 基于对抗主动学习的异构图神经网络伪造新闻检测;
- 模拟意见领袖在创新传播中的作用;
- 随时间测量法律:网络分析框架及其在美国和德国的法规的应用;
- 社会网络中的启动器和目标;
- 赞助搜索拍卖的三角拍卖词生成;
- 为什么民意调查无法预测选举;
- 流行病学的场论基础;
- 粒子群优化器中的个人和社会行为;
- 从社交媒体获取旅行者行为信息:以Twitter为例的曼哈顿案例研究;
- 在Twitter上调查科学知识的传播:阿片类药物出版物的主题网络研究;
- 公平的平衡:在功能函数形式的博弈中利用物理进行公平分配;
- 邻域图摘要;
音调和声与动态乐谱网络拓扑
原文标题: Tonal harmony and the topology of dynamical score networks
地址: http://arxiv.org/abs/2006.01033
作者: Marco Buongiorno Nardelli
摘要: 我们介绍了动态乐谱网络的概念,用于表示和分析音调成分:乐谱被解释为一个动态网络,其中每个和弦都是一个节点,并且每个进程都将连续的和弦链接在一起。可以将该网络视为非平稳信号的时间序列,因此可以将其划分为使用时间序列分析和变化点检测来自动识别音调区域,而无需依赖与预定参考集或广泛的语料库。我们证明了色调和谐,中心性,参照性,有向性和等级性的基本特征是从网络拓扑结构及其无标度特性中自然而然地出现的。最后,通过在这些图上通过路由优化算法求解最小长度路径,可以提供谐波序列的抽象,可以将其泛化为音调成分设计生成模型的概念。
紧密协作网络模型
原文标题: A Model of Densifying Collaboration Networks
地址: http://arxiv.org/abs/2101.11056
作者: Keith A. Burghardt, Allon G. Percus, Kristina Lerman
摘要: 研究合作为科学进步提供了基础,但是直到最近我们才开始理解它们如何在全球范围内形成和发展。在这里,我们分析了研究合作网络增长的模型,以解释经验观察:合作数量与机构规模呈超线性比例关系,尽管以不同的速率(异质致密化),机构数量随着研究人员数量的增长而增长(堆定律)和机构规模近似于齐普夫定律。该模型具有三种机制:(i)大型机构优先聘用研究人员;(ii)新机构触发更多潜在机构;(iii)研究人员与朋友之友合作。通过分析跨两个世纪的合著者网络,我们证明了这些假设与经验数据之间的一致性。然后,我们对这种模型进行了理论上的理解,揭示了新兴的异质性尺度,从而使机构之间的协作数量随机构的规模而扩展。
REFORM:更换子团队的快速,自适应解决方案
原文标题: REFORM: Fast and Adaptive Solution for Subteam Replacement
地址: http://arxiv.org/abs/2101.11070
作者: Zhaoheng Li, Xinyu Pi, Mingyuan Wu, Hanghang Tong
摘要: 在本文中,我们提出了“子团队替换”的新问题:给一个嵌入社会网络中的团队来完成某项任务,并且该团队中的一部分成员(子团队)已经不可用,请寻找另一组成员谁可以在较大的团队中扮演子团队的角色。同时替换多个团队成员的能力在诸如公司管理之类的环境中受到高度赞赏,在企业管理中,团队结构高度易变,大规模变更是司空见惯的。我们猜想一个好的候选子团队应该与被替换的子团队具有高技能和结构相似性,同时与整个大团队共享相似的联系。基于此推测,我们提出了一种新颖的图核,该核以这种整体方式评估候选子团队的优劣,可根据情况的需要自由调整。为理解决重大的计算困难,我们将内核与快速近似算法结合在一起,该算法(a)采用有效的修剪策略,(b)利用候选团队结构之间的相似性来减少内核计算,并且(c)具有获得的坚实理论界限问题的数学性质。我们在合成数据集和真实数据集上广泛测试了我们的解决方案,以证明其一致性和效率。与先前工作中使用的图内核相比,我们提出的图内核导致提出了更合适的替代方案,并且我们的算法通过找到近似最优的解决方案,同时随替换子团队的规模线性扩展,始终优于其他选择。
探索用于社交媒体中仇恨言语和攻击性言语识别的transformer模型的多任务多语言学习
原文标题: Exploring multi-task multi-lingual learning of transformer models for hate speech and offensive speech identification in social media
地址: http://arxiv.org/abs/2101.11155
作者: Sudhanshu Mishra, Shivangi Prasad, Shubhanshu Mishra
摘要: 仇恨言论已成为在线社交媒体平台的主要内容审核问题。考虑到在线内容制作的数量和速度,不可能在任何平台上手动审核与仇恨言论相关的内容。在本文中,我们基于最近提出的Transformer神经网络利用多任务和多语言方法来解决仇恨语音的三个子任务。这些子任务是2019年印欧语言仇恨言论和攻击性内容(HASOC)识别共享任务的一部分。我们通过使用通过三种方法训练的多任务模型来扩展向竞赛的提交,a)具有单独任务头的多任务学习,b)反向翻译,以及c)多语言培训。最后,我们研究了各种模型的性能,并确定了基于Transformer的模型表现不同且更好的实例。我们表明,可以利用不同的组合方法来获得可以轻松地在不同语言和任务上进行归纳的模型,同时以较低的推理时间(在某些情况下)为代价,从而大大降低了推理时间的计算成本。我们在https://github.com/socialmediaie/MTML_HateSpeech上开放了HASOC 2019代码的更新版本以及新的改进。
小世界网络:综述和属性分析
原文标题: On Small-World Networks: Survey and Properties Analysis
地址: http://arxiv.org/abs/2101.11191
作者: Alaa Eddin Alchalabi
摘要: 在过去的几年中,复杂网络一直是跨学科研究的热门话题,从数学和计算机科学开始,以社会和生物科学为结束。研究了随机图以观察它们在行星尺度数据集中共有的定性特征,这有助于我们将已证明的见解投射到现实世界的网络中。在本文中,我们调查了小世界现象和分散搜索算法的特殊情况。我们首先解释关于社会网络中六种分离现象的第一项实证研究。然后,基于这些工作,我们回顾了一些概率网络模型,阐述了这些模型如何解释现象特性,最后,我们回顾了由这些模型支持的最新实证研究。最后,在该研究领域中提出了一些未来的工作。
基于对抗主动学习的异构图神经网络伪造新闻检测
原文标题: Adversarial Active Learning based Heterogeneous Graph Neural Network for Fake News Detection
地址: http://arxiv.org/abs/2101.11206
作者: Yuxiang Ren, Bo Wang, Jiawei Zhang, Yi Chang
摘要: 虚假新闻的爆炸性增长以及对政治,经济和公共安全的破坏性影响,增加了对虚假新闻检测的需求。社交媒体上的虚假新闻并非以文章的形式独立存在。许多其他实体,例如新闻创建者,新闻主题等,都存在于社交媒体上并与新闻文章有关系。可以将不同的实体和关系建模为异构信息网络(HIN)。在本文中,我们尝试在面向新闻的HIN的支持下解决假新闻检测问题。我们提出了一种新颖的假新闻检测框架,即基于对抗主动学习的异构图神经网络(AA-HGNN),该框架采用了一种新颖的分层注意力机制来在HIN中执行节点表示学习。 AA-HGNN利用主动学习框架来增强学习性能,尤其是在面对标签数据较少的情况下。对抗选择器将被训练为主动学习框架查询高价值的候选人。对抗式主动学习完成后,AA-HGNN通过对新闻文章节点进行分类来检测虚假新闻。对两个真实世界的虚假新闻数据集进行的实验表明,当使用对抗性主动学习中受益较少的标记数据时,我们的模型可以胜过基于文本的模型和其他基于图的模型。作为具有可推广性的模型,AA-HGNN还具有在异构图上广泛用于其他节点分类相关应用程序的能力。
模拟意见领袖在创新传播中的作用
原文标题: Modeling opinion leader's role in the diffusion of innovation
地址: http://arxiv.org/abs/2101.11260
作者: Natasa Vodopivec, Carole Adam, Jean-Pierre Chanteau
摘要: 创新的传播是消费市场的重要主题。早期的研究集中于创新如何在整个社会范围内传播。为了更接近真实场景,基于主体的模型(ABM)开始关注个人级别的主体。在我们的工作中,我们将把现有的ABM(用于调查意见领袖在创新传播过程中的作用)转换为专为基于主体的建模而设计的新的,更具表达能力的平台GAMA。我们将这样做表明,将来在社会科学领域建立模型时,应鼓励利用所选平台的新功能,因为这可能有助于模拟结果的解释能力。
随时间测量法律:网络分析框架及其在美国和德国的法规的应用
原文标题: Measuring Law Over Time: A Network Analytical Framework with an Application to Statutes and Regulations in the United States and Germany
地址: http://arxiv.org/abs/2101.11284
作者: Corinna Coupette, Janis Beckedorf, Dirk Hartung, Michael Bommarito, Daniel Martin Katz
摘要: 复杂的社会系统如何在现代世界中发展?这个问题是社会物理学的核心,事实证明,网络分析对于提供答案至关重要。近年来,网络分析还被用来获得对法律作为复杂的自适应系统的定量理解,但是大多数研究集中在单一类型的法律文件上,并且不存在使用网络分析对法律文件进行定量分析的统一框架。工具。在这种背景下,我们提出了一个综合的框架,可将法律文件分析为多维动态文件网络。通过将其应用到来自两个不同国家(美国和德国)的成文法规的原始数据集,我们展示了该框架的效用,跨越了二十多年( 1998 - 2019 )。我们的框架提供了用于评估法律系统的规模和连通性的工具,这些工具是从特定文件收集的角度来看的,并且可以跟踪各个法律文件随时间的演变。实施我们的数据集框架,我们发现在联邦一级,美国法律体系越来越受到法规的支配,而德国法律体系仍然受法规的约束。无论我们是在宏观,中观还是微观层面上衡量系统,这一点都成立。
社会网络中的启动器和目标
原文标题: Launchers and Targets in Social Networks
地址: http://arxiv.org/abs/2101.11337
作者: Pedro Martins, Filipa Alarcão Martins
摘要: 社会网络中的影响力传播日益引起人们的关注。这些网络中的一个相关问题涉及关键影响者的识别。这些参与者在病毒式营销策略和消息传播(包括政治宣传和虚假新闻)中起着重要作用。实际上,对抗社会网络上的恶意使用的一种重要方法是理解其属性,结构和消息传播的方式。本文基于网络的拓扑性质和消息的力量,提出了两个新的指标来分析社会网络中的消息传播。第一个索引涉及每个节点作为消息启动器的强度,将节点分为启动器和非启动器。第二个索引解决了每个成员作为消息的接收者(目标)的潜力,将节点分为目标和非目标。发射者个人应表明强大的影响者,目标个人应确定最佳目标消费者。当用于在社会网络中选择有效的影响者时,这些索引可以辅助其他已知的指标。例如,我们可能没有事先根据其在网络中的程度(关注者数量)选择一个强大且可能昂贵的成员,而是选择了那些属于发射者组的成员,并寻找最低级别的成员,这些成员可能更便宜但仍在保证中影响程度几乎与最高学位成员相同。在不同的方向上,使用第二个索引,强大的目标成员应该表征网络中相关信息的使用者,其中可能包括虚假新闻的定期收集者。我们使用小世界随机生成的图和已知数据集存储库中可用的许多现实世界社会网络来讨论这些索引。
赞助搜索拍卖的三角拍卖词生成
原文标题: Triangular Bidword Generation for Sponsored Search Auction
地址: http://arxiv.org/abs/2101.11349
作者: Zhenqiao Song, Jiaze Chen, Hao Zhou, Lei Li
摘要: 赞助搜索拍卖是现代搜索引擎的重要组成部分。它需要广告商可以对其进行出价的一组候选投标词。现有方法从搜索查询或广告内容中生成关键字。但是,它们受
为什么民意调查无法预测选举
原文标题: Why polls fail to predict elections
地址: http://arxiv.org/abs/2101.11389
作者: Zhenkun Zhou, Matteo Serafino, Luciano Cohan, Guido Caldarelli, Hernan A. Makse
摘要: 在过去的十年中,我们见证了传统民意测验无法预测全世界的总统选举结果。为了理解这些失败背后的原因,我们分析了一个受信任的民意调查机构的原始数据,该数据未能与其他民意调查员一起预测阿根廷令人惊讶的2019年总统大选,从而导致该国的主要市场崩溃。对选举前后进行的纵向调查得出的原始数据和重新加权的数据进行的分析表明,存在明显的偏差(超出了众所周知的低响应率),这与人口代表性错误有关,最重要的是与社会可取性偏差有关,也就是说,受访者倾向于隐藏自己对有争议的候选人进行投票的意图。然后,我们提出了一种基于社交媒体,机器学习和网络理论的大数据分析的纵向意见跟踪方法,该方法克服了传统民意测验的局限性。该模型在2019年阿根廷大选中取得了准确的结果,预测候选人阿尔贝托·费尔南德斯(Alberto Fern'andez)压倒性地击败了总统毛里西奥·马克里(Mauricio Macri);结果,该国的传统民意调查者都无法预测。除了预测政治选举之外,我们提出的框架更为笼统,可用于发现社会趋势。例如,人们对经济学,教育或气候变化的看法。
流行病学的场论基础
原文标题: The field theoretical ABC of epidemic dynamics
地址: http://arxiv.org/abs/2101.11399
作者: Giacomo Cacciapaglia, Corentin Cot, Michele Della Morte, Stefan Hohenegger, Francesco Sannino, Shahram Vatani
摘要: 我们不仅仅对用于描述传染病扩散的几种主要数学模型进行系统的综述,而且还展示了不同方法之间的关系。结果表明,这些框架在时间重定标度下具有共同的特征,如临界度和自相似性。这些特征自然是在统一领域理论方法中编码的。后者通过明确实现(近)时间膨胀不变性的框架,有效地描述了疾病的时间演变。在需要时,可以扩展模型以解决观察到的现象,例如多波动力学。尽管我们将COVID-19大流行视为一种明确的现象学应用,但此处介绍的模型对于从医学应用到对人类行为的理解等不同的科学探究领域都具有直接的相关性。
粒子群优化器中的个人和社会行为
原文标题: Individual and Social Behaviour in Particle Swarm Optimizers
地址: http://arxiv.org/abs/2101.11439
作者: Johann Sienz, Mauro S. Innocente
摘要: 三个基本因素控制着粒子的各个行为:粒子先前位移的惯性;对自身最佳体验的吸引力;以及对给定邻居的最佳体验的吸引力。赋予每个因素的重要性由三个系数控制:惯性;个性和社交权重。社交行为由社会网络的结构决定,社会网络的结构定义了邻居,这些邻居将向特定粒子告知其经历。本文研究了系数不同设置的影响以及不同设置和不同邻域拓扑对收敛速度和形式的综合影响。
从社交媒体获取旅行者行为信息:以Twitter为例的曼哈顿案例研究
原文标题: Deriving the Traveler Behavior Information from Social Media: A Case Study in Manhattan with Twitter
地址: http://arxiv.org/abs/2101.11482
作者: Zhenhua Zhang
摘要: 诸如Twitter之类的社交媒体平台为处理交通问题提供了全新的视角,并有望补充传统方法。带有地理标签的推文可以提供Twitter用户的位置信息,并将其应用于旅行者行为分析中。本文探讨了Twitter在推导出行行为信息方面的全部潜力,并在曼哈顿地区进行了案例研究。提出了一种从Twitter位置提取位移信息的系统方法。我们的研究表明,Twitter拥有独特的人口统计数据,不仅将本地居民,而且将游客或乘客也纳入其中。对于个人用户,Twitter可以发现他/她的旅行行为功能,包括工作日和周末的时间和位置分布。对于所有Twitter用户,汇总的旅行行为结果还显示,曼哈顿岛的每日旅行模式与交通流量相似;通过与旅行调查结果进行比较,OD模式的识别也很有希望。
在Twitter上调查科学知识的传播:阿片类药物出版物的主题网络研究
原文标题: Investigating Diffusion of Scientific Knowledge on Twitter: A Study of Topic Networks of Opioid Publications
地址: http://arxiv.org/abs/2101.11483
作者: Robin Haunschild, Lutz Bornmann, Devendra Potnis, Iman Tahamtan
摘要: 评估科学研究价值的一种方法是衡量其在社交媒体上的关注度。尽管以前的研究主要集中在社交媒体上科学研究的“提及数”,但当前的研究使用“主题网络”来衡量公众对Twitter科学研究的关注。这项研究的主题网络是科学出版物中的“共同出现的作者关键词”和推文中提及科学出版物的“共同出现的主题标签”。由于僵尸程序(自动社交媒体帐户)可能会显著影响公众的注意力,因此本研究还调查了基于所有帐户(僵尸程序帐户和非僵尸程序帐户)推文的主题网络是否与非僵尸程序帐户的主题网络不同。我们的分析基于一组2011年至2019年的阿片类药物科学出版物以及与之相关的推文。我们使用共现网络分析来生成主题网络。结果表明,公众大多使用通用术语来讨论阿片类药物出版物。结果证实,主题网络提供了一种可视化的方法来可视化(健康相关的)科学出版物的公众讨论,以及公众如何与科学界不同地讨论(健康相关的)科学研究。根据所有帐户和非僵尸帐户的推文,主题网络之间存在重大重叠。该结果表明,在生成主题网络时,无需排除机器人帐户,因为它们对结果的影响可忽略不计。
公平的平衡:在功能函数形式的博弈中利用物理进行公平分配
原文标题: A Balance for Fairness: Fair Distribution Utilising Physics in Games of Characteristic Function Form
地址: http://arxiv.org/abs/2101.11496
作者: Song-Ju Kim, Taiki Takahashi, Kazuo Sano
摘要: 在混乱的现代社会中,越来越需要实现真正的“公平”。在希腊神话中,“正义女神”西米斯(Themis)的右手握有一把剑,以保护社会免受邪恶之害,而左手则拥有“判断平衡”,以衡量善恶。在这项研究中,我们提出了一种公平分配方法“利用物理学”,以利用特征函数形式的博弈利润。具体而言,我们表明,通过将线性规划问题视为重力起作用的物理系统,可以有效地解决用于计算“核仁”的线性规划问题。我们相信,除了能够显著降低计算复杂度之外,该系统还可以具有响应参数实时变化所需的灵活性。
邻域图摘要
原文标题: A Neighborhood-preserving Graph Summarization
地址: http://arxiv.org/abs/2101.11559
作者: Abd Errahmane Kiouche, Julien Baste, Mohammed Haddad, Hamida Seba
摘要: 我们在本文中介绍了一种新的大图汇总方法。我们的汇总方法仅保留用户指定的图中每个节点的邻居比例。我们的主要目的是简化大型图,以便可以在保留尽可能多的节点邻域属性的同时,对其进行有效的分析和处理。由于许多图算法均基于每个节点可用的邻域信息,因此其想法是产生一个较小的图,该图可用于允许这些算法处理大图并在提供良好近似的同时运行得更快。此外,我们的压缩功能允许用户通过调整可容忍的信息丢失量来控制压缩图的大小。在各种实图和合成图上进行的实验表明,我们的压缩大大减小了图的大小。此外,我们使用各种图算法和应用程序对获得的摘要进行了一些实验,例如节点嵌入,图分类和最短路径逼近。获得的结果显示了算法运行时加速和精度损失之间的有趣折衷。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。