- DeepTrax:金融交易图嵌入;
- 建模人类注释错误以设计用于社交流处理的考虑偏差的系统;
- 紧急服务多模社交媒体流的相关分类;
- 参与式媒体内容推荐和排名的公平性和多样性;
- beta-skeleton图的几何和谱研究;
- 使用深度卷积神经网络将缓存作为图像表征问题;
- 社会科学中的纠缠;
- DeepNC:深度生成网络补全;
- Glauber动态社会平衡网络模型的相变;
- 一类随机无标度网络的构造和性质;
- 多家庭自我反思的DSGE模型中的自信崩溃;
- 计算人类动力学;
- 迈向可靠的在线钓鱼视频检测:内容不可知的方法;
DeepTrax:金融交易图嵌入
原文标题: DeepTrax: Embedding Graphs of Financial Transactions
地址: http://arxiv.org/abs/1907.07225
作者: C. Bayan Bruss, Anish Khazane, Jonathan Rider, Richard Serpe, Antonia Gogoglou, Keegan E. Hines
摘要: 金融交易可以被视为在发送货币的实体和接收货币的实体之间的异构图中的边。对于金融机构而言,这样的图表可能很大(具有数百万或数十亿的边),同时也是稀疏连接的。将机器学习应用于如此大且稀疏的图变得具有挑战性。图表示学习试图将图的节点嵌入到欧几里德向量空间中,使得图拓扑属性在变换之后被保留。在本文中,我们提出了一种新的表示学习应用于信用卡交易的二部图,以学习帐户和商家实体的嵌入。我们的框架受到图嵌入中流行方法的启发,并在两个内部事务数据集上进行了培训。该方法产生高效嵌入,如通过链路预测AUC和F1得分量化的。此外,得到的实体向量保留直观的语义相似性,通过可视化和其他定性分析进行探索。最后,我们将展示如何将这些嵌入用作下游机器学习业务应用程序(如欺诈检测)中的功能。
建模人类注释错误以设计用于社交流处理的考虑偏差的系统
原文标题: Modeling Human Annotation Errors to Design Bias-Aware Systems for Social Stream Processing
地址: http://arxiv.org/abs/1907.07228
作者: Rahul Pandey, Carlos Castillo, Hemant Purohit
摘要: 为社交媒体创建有效的机器学习系统需要高质量的人工注释。低质量的人类注释间接导致了不准确或有偏见的学习系统的产生。我们展示了人类注释质量取决于向注释者显示的实例的排序(称为“注释计划”),并且可以通过提供给注释器的实例排序中的局部更改来改进,从而产生更准确的数据流注释。用于高效的实时社交媒体分析。我们提出了一种减轻错误的主动学习算法,该算法在决定注释时间表时对于某些人为错误的情况是健壮的。我们通过在危机期间试验相关社交媒体帖子的分类任务来验证人为错误模型并针对强基线评估所提出的算法。根据这些实验,考虑到将数据实例呈现给人类注释器的顺序导致机器学习的准确性的提高和对可能影响自动分类器的人类学习中的一些潜在偏差的意识。
紧急服务多模社交媒体流的相关分类
原文标题: Relevancy Classification of Multimodal Social Media Streams for Emergency Services
地址: http://arxiv.org/abs/1907.07240
作者: Ganesh Nalluru, Rahul Pandey, Hemant Purohit
摘要: 社交媒体已成为我们日常生活中不可或缺的一部分。在时间紧迫的活动中,公众在社交媒体上分享各种帖子,包括针对受影响社区的资源需求,损害赔偿和帮助提供的报告。这些职位可能具有相关性,可能包含有价值的态势感知信息。然而,社交媒体的信息过载挑战了紧急服务及时处理和提取相关信息。此外,近年来社交媒体帖子中多媒体内容的使用日益增加,进一步增加了从社交媒体中及时挖掘相关信息的挑战。在本文中,我们提出了一种新的社交媒体帖的多模态相关性分类方法,其中相关性是根据应急管理机构的信息需求来定义的。具体来说,我们尝试将语义文本特征与图像特征相结合,以有效地对相关的多模社交媒体帖子进行分类。我们使用对来自三个真实世界危机事件的数据进行分类的评估来验证我们的方法。我们的实验表明,基于所提出的利用文本和图像内容的混合框架的特征提高了识别相关帖子的性能。根据这些实验,所提出的分类方法的应用可以减少对紧急服务的认知负担,从而大规模地过滤多模式公共职位。
参与式媒体内容推荐和排名的公平性和多样性
原文标题: Fairness and Diversity in the Recommendation and Ranking of Participatory Media Content
地址: http://arxiv.org/abs/1907.07253
作者: Muskaan, Mehak Preet Dhaliwal, Aaditeshwar Seth
摘要: 在线参与式媒体平台,实现用户之间的一对多通信,查看大量用户生成的内容,并因此面临能够向其用户推荐该内容的子集的问题。我们解决了推荐和排名这些内容的问题,以便关于主题的不同观点以公平和多样的方式得到曝光。我们在印度中部农村地区建立基于语音的参与式媒体平台,为低收入和低文化社区建立我们的模式,通过电话向用户播放排序列表中的音频消息并允许他们贡献他们自己的消息。在本文中,我们描述了我们的模型,并使用来自平台的调用日志对其进行评估,以将模型的公平性和多样性性能与当前遵循的手动编辑过程进行比较。我们的模型是通用的,可以调整并应用于其他参与性媒体平台。
beta-skeleton图的几何和谱研究
原文标题: Geometrical and spectral study of beta-skeleton graphs
地址: http://arxiv.org/abs/1907.07262
作者: L. Alonso, J. A. Méndez-Bermúdez, Ernesto Estrada
摘要: 我们对 beta -skeleton图进行了广泛的数值分析,这是一种特殊类型的邻近图。在 beta -skeleton图(BSG)中,如果满足依赖于参数 beta in(0, inf)的接近规则,则连接两个顶点。此外,对于 beta> 1 ,存在两种不同的邻近规则,导致基于lune和基于圈的BSG。首先,通过计算BSG的大集合的平均程度,我们检测基于Lune和基于圆的BSG之间的差异,其随着 beta 的增加而增加。然后,在随机矩阵理论(RMT)方法中,我们分别通过使用最近邻能级间隔分布和熵特征向量定位长度来探索随机加权BSG的谱和特征向量性质。 RMT分析使我们得出结论,本地化转换发生在 beta = 1 。
使用深度卷积神经网络将缓存作为图像表征问题
原文标题: Caching as an Image Characterization Problem using Deep Convolutional Neural Networks
地址: http://arxiv.org/abs/1907.07263
作者: Yantong Wang, Vasilis Friderikos
摘要: 在过去几年中,优化流行内容的缓存位置已经获得了重要的研究关注。本文通过提出一种新的优化问题转换为适用于深度卷积神经网络(CNN)的灰度图像,来优化缓存位置。所提出的建模的合理性来自于CNN在灰度图像中捕获特征的优越性,在图像识别问题中达到人类水平的性能。 CNN已经过最优解的训练,数值研究和分析证明了该方法的有希望的性能。因此,为了实现实时决策,我们从基于严格优化的框架转向使用数据驱动方法的优化融合。
社会科学中的纠缠
原文标题: Tangles in the social sciences
地址: http://arxiv.org/abs/1907.07341
作者: Reinhard Diestel
摘要: 传统聚类标识共享某些特性的对象组。纠缠反之:他们确定经常一起出现的品质群。因此,他们可以识别和发现“类型”:行为,观点,能力,倾向。纠缠的数学理论起源于图的连通性理论,它在过去的30年中已经发生了变化。它最近被公理化,使其两个最深的结果适用于更广泛的背景。这篇说明文件指出了这种方法差异特别显著的一些背景。但这些仅仅是这种背景的例子:原则上,它可以应用于大量的定量社会科学。我们这里的目标是双重的:表明纠缠理论的足够多,以说明它如何在各种不同的环境中起作用,并提供大量不同的例子来说明这一点。
DeepNC:深度生成网络补全
原文标题: DeepNC: Deep Generative Network Completion
地址: http://arxiv.org/abs/1907.07381
作者: Cong Tran, Won-Yong Shin, Andreas Spitz, Michael Gertz
摘要: 大多数网络数据仅从具有缺失节点和边的部分可观察网络收集,例如由于用户在社交媒体上指定的有限资源和隐私设置。因此,它表明通过执行网络完成来推断网络的缺失部分应该先于网络上的下游挖掘或学习任务。然而,尽管有这种需要,但是在这种不完整的网络中丢失节点和边的恢复是一个未充分研究的问题。在本文中,我们介绍了DeepNC,一种用于推断基于深度生成图模型的网络缺失部分的新方法。具体而言,我们的模型首先通过基于递归神经网络(RNN)的生成图学习边上的可能性,然后识别最大化以可观察图拓扑为条件的学习似然的图。此外,我们提出了一种计算上有效的DeepNC算法,该算法连续地找到单个节点以最大化每个节点生成步骤中的概率,其运行时复杂度几乎与网络中的节点数量成线性关系。我们凭经验证明了DeepNC在各种合成和现实世界网络上的先进网络完成方法的优越性。
Glauber动态社会平衡网络模型的相变
原文标题: Phase transition in a network model of social balance with Glauber dynamics
地址: http://arxiv.org/abs/1907.07389
作者: Rana Shojaei, Pouya Manshour, Afshin Montakhab
摘要: 我们通过引入具有内在随机性的动力学模型来研究具有友好/敌意关系的社会网络向平衡状态的演化,类似于统计力学中的Glauber动力学。我们包括促进张力的可能性以及我们模型中的张力减少。这种更现实的情况使得系统能够从其能量景观中逃离局部最小值,从而退出冻结的不平衡状态,这是在先前模型中观察到的不希望的结果。另一方面,在有限网络中,如果随机性低于临界值,则动态将系统带入平衡阶段。对于大型网络,我们还发现在 rho_0 ^ = 1/2 的初始正链路密度处出现了明显的相位转换,其中系统从双极状态转变为天堂。在最近的研究中观察到,这会以非平凡值 rho_0 ^ = 0.65 修改渐变相变。
一类随机无标度网络的构造和性质
原文标题: Constructions and properties of a class of random scale-free networks
地址: http://arxiv.org/abs/1907.07406
作者: Xiaomin Wang, Fei Ma
摘要: 复杂网络在现实生活中具有丰富而广泛的应用。最近,研究人员提出了许多复杂的网络,其中一些是确定性的,另一些是随机的。与确定性网络相比,随机网络不仅有趣且典型,而且可用于说明和研究许多现实世界的复杂网络,特别是对于随机无标度网络。这里,我们介绍三种类型的操作,即类型A操作,类型B操作和类型C操作,用于生成随机无标度网络 N(p,q,r,t)。在我们的运营基础上,我们提出了生成网络的具体过程,它构成了网络空间 mathcal N(p,q,r,t),然后讨论它们的拓扑性质。首先,我们计算网络空间中每个成员的平均度的范围,并发现每个成员都是稀疏网络。其次,我们证明我们空间中的每个成员都服从幂律指数为 gamma = 1 + frac ln(4-r) ln2 ,这意味着每个成员都是规模 - 自由。接下来,我们分析直径,发现由于B型操作,直径可能从小到大突然转变。然后,我们研究网络的聚类系数,发现它的值仅由C类操作决定。最后,我们做出了精心的结论。 textbf 关键词:随机网络;学位分布;直径;聚类系数。
多家庭自我反思的DSGE模型中的自信崩溃
原文标题: Confidence Collapse in a Multi-Household, Self-Reflexive DSGE Model
地址: http://arxiv.org/abs/1907.07425
作者: Federico Guglielmo Morelli, Michael Benzaquen, Marco Tarzia, Jean-Philippe Bouchaud
摘要: 我们研究了一个多户DSGE模型,其中过去的总消费量会影响个体家庭的信心,从而影响消费倾向。我们发现这种最小化的设置非常丰富,并且可以产生各种逼真的输出动态:高输出而没有危机;高产出,波动加剧,经济衰退持续时间短暂;高输出和低输出状态的交替,经济条件相对温和的下降可能导致暂时的信心崩溃和经济活动的急剧下降。危机概率以指数方式取决于模型的参数,这意味着市场无法有效地为相关的风险溢价定价。最后,我们强调在我们的框架内, it叙事成为一种重要的货币政策工具,可以帮助推动经济重回正轨。
计算人类动力学
原文标题: Computational Human Dynamics
地址: http://arxiv.org/abs/1907.07475
作者: Márton Karsai
摘要: 本文总结了我在网络科学,人类动力学和计算社会科学领域的科学贡献。这些贡献与计算机科学,物理学,统计学和应用数学有关。本论文的目标是双重的,一方面写出我最有趣的科学贡献的简明总结,另一方面提供关于我的领域的最新观点和观点。我开始撰写论文,介绍将读者放在我的领域的景观上,并从视角看我的贡献。在第二章中,我将重点放在我关于突发人类动态的工作上,解决人类行为和交互的异质时间特征。接下来,我将讨论我对时间网络领域的贡献,并对我在时变结构的表示,表征和建模的各种方法上的工作进行综合。最后,我讨论了关于集体社会现象的数据驱动观察和建模的工作。在那里,我总结了关于社会经济不平等的紧急模式的静态观察及其与社会交流网络的相关性以及语言模式的研究。我还讨论了社会传染过程的动态观察和建模。
迈向可靠的在线钓鱼视频检测:内容不可知的方法
原文标题: Towards Reliable Online Clickbait Video Detection: A Content-Agnostic Approach
地址: http://arxiv.org/abs/1907.07604
作者: Lanyu Shang, Daniel Zhang, Michael Wang, Shuyue Lai, Dong Wang
摘要: 在线视频共享平台(例如,YouTube,Vimeo)已经成为人们消费视频内容的越来越流行的范例。 Clickbait视频,其内容明显偏离其标题/缩略图,已成为在线视频共享平台的关键问题。当前专注于分析标题文本,缩略图图像或视频内容的点击检测解决方案在检测在线点击视频时显示为次优。在本文中,我们开发了一种新颖的内容无关的方案,即在线视频点击保护器(OVCP),通过探索观看视频的观众的评论来有效地检测点击视频。与现有解决方案不同,OVCP不直接分析视频的内容及其预点击信息(例如,标题和缩略图)。因此,它对于经常生成可以绕过当前clickbait检测器的clickbait视频的复杂内容创建者来说是健壮的。我们使用从YouTube收集的真实数据集评估OVCP。实验结果表明,OVCP可有效识别clickbait视频,并且显著优于最先进的基线模型和人类注释器。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。