- 从研究视角看维基数据——维基数据的系统映射研究;
- 社会网络个人资料的大规模并行匹配;
- 使用图卷积网络进行基于拓扑的分类;
- 社区问答平台答案选择的诱导多关系框架;
- 迈向自动化的性暴力报告跟踪;
- 利用空腔方法研究有向控制集问题:警告传播和人口动态;
- 随机网络SIRS模型自我持续振荡的涌现;
- 小世界网络SIRS模型临界阈值;
- 通过时空交互挖掘大型在线社会网络取关行为;
- 社交媒体谣言检测:数据集、方法和机会;
- 通过基于注意力的多任务跨媒体维度建模理解教学风格;
- 用穿戴式传感器检测拥挤社会场景的F-结构和角色:使用LSTMs结合空间关系学和动力学;
- 通过卷积神经网络学习复杂网络传染病阈值;
- 使用层依赖重要性抽样训练深度大型图卷积网络;
- 二阶模型的麻烦,或如何用一阶模型产生停停走走的交通;
- 随机游走应用于假冒账号检测问题:一种混合方法;
- 当巧合具有意义:通过信息令牌复发网络理解涌现;
从研究视角看维基数据——维基数据的系统映射研究
原文标题: Wikidata from a Research Perspective -- A Systematic Mapping Study of Wikidata
地址: http://arxiv.org/abs/1908.11153
作者: Mariam Farda-Sarbas, Claudia Müller-Birn
摘要: 维基数据是包含结构化数据的最编辑知识基地之一。它作为在维基媒体领域,并超出了很多项目的数据源。自2012年10月成立以来,它已经越来越多地在其两个社群和其内容的长期增长。这种增长是通过扩大数量的研究,重点维基数据反映出来。我们的研究旨在通过提供一个系统的映射的研究,以确定现有研究的当前局部覆盖以及其需要进一步调查的白色斑点维基数据进行研究的概况。在这项研究中,选择了从期刊和会议论文67同行评审的研究,并分成有意义的类别。我们描述性的描述这组数据通过展示发布频率,发布地点和作者的由来,揭示目前的研究重点。这些特别包括有关数据质量,包括与语言覆盖面和数据完整性的问题方面。这些结果表明了一些未来的研究方向,例如,多种语言和克服语言的差距,许多对维基数据的数据,维基数据的各个学科的潜力,以及用户界面的可用性的质量的影响。
社会网络个人资料的大规模并行匹配
原文标题: Large-Scale Parallel Matching of Social Network Profiles
地址: http://arxiv.org/abs/1911.06861
作者: Alexander Panchenko, Dmitry Babaev, Sergei Obiedkov
摘要: 配置文件匹配算法中,输入一个社会网络和回报的用户配置文件,如果存在的话,同一个人在另一个社会网络的配置文件。这种方法在网络营销,搜索,安全,和许多其他领域的,这就是为什么这个话题看到了普及最近激增的现成应用。在本文中,我们提出使用最少的监控,并以0.54召回达到0.98的精度的用户身份解析方法。此外,该方法在计算上是有效的并且容易并行化的。我们表明,该方法可用于匹配的Facebook,最流行的社会网络在全球范围与VKontakte等,讲俄语的用户中最流行的社会网络。
使用图卷积网络进行基于拓扑的分类
原文标题: Topological based classification using graph convolutional networks
地址: http://arxiv.org/abs/1911.06892
作者: Roy Abel, Idan Benami, Yoram Louzoun
摘要: 在彩色图中,节点类通常与它们的邻居类或在与每个节点相关联的图不掺入信息相关联。在这里,我们建议节点类也与节点的拓扑特征有关。我们使用这种关联来提高总体图机器学习和具体而言,图卷积网络(GCN)。首先,我们表明,即使在不存在的节点上的任何外部信息,可以在节点类的使用任一拓扑特征,或使用邻居类作为输入到GCN预测得到良好的精度。这种精度是略小于可以使用基于内容GCN获得一个。其次,我们表明,明确增加拓扑作为输入到GCN时与节点外部信息相结合,并不能提高精度。然而,添加与类似的拓扑结构的GCN远距离节点之间的边不显著提高其精度的附加邻接矩阵,导致的结果比在多个数据集的现有技术方法的所有状态更好。
社区问答平台答案选择的诱导多关系框架
原文标题: An Induced Multi-Relational Framework for Answer Selection in Community Question Answer Platforms
地址: http://arxiv.org/abs/1911.06957
作者: Kanika Narang, Chaoqi Yang, Adit Krishnan, Junting Wang, Hari Sundaram, Carolyn Sutter
摘要: 本文针对识别的最佳人选答案社区问题解答(CQA)论坛提问的问题。因为个人经常光顾CQA论坛寻求答案细致入微的问题,问题是很重要的。我们开发引起的关系图卷积网络(IR-GCN)架构来解决问题的小说。我们提出三点贡献。首先,我们引入了模块化的框架分开与标签选择机制的图的构造。我们用等价关系诱导图包含在派系和识别两种标签分配机制---标签相反,标签共享。然后,我们将展示如何来编码GCNs这些分配机制。其次,我们表明,编码对比产生歧视性放大---加强在嵌入空间节点之间的距离。第三,我们展示了一个令人惊讶的结果---提升技术提高学习了熟悉的叠加,融合,或聚集接近神经结构。我们展示了在50个StackExchange社区中广泛的实验状态的最先进的神经基线的强劲业绩。
迈向自动化的性暴力报告跟踪
原文标题: Towards Automated Sexual Violence Report Tracking
地址: http://arxiv.org/abs/1911.06961
作者: Naeemul Hassan, Amrit Poudel, Jason Hale, Claire Hubacek, Khandakar Tasnim Huq, Shubhra Kanti Karmaker Santu, Syed Ishtiaque Ahmed
摘要: 追踪性暴力是一项艰巨的任务。在本文中,我们提出了一种基于监督学习的自动性暴力报告跟踪模型比其基于众包的同行更可扩展和可靠。我们考虑受害者,肇事者上下文和暴力的性质界定性暴力报告的跟踪问题。我们发现,我们的模型能识别用精密性暴力的报告和80.4%和83.4%的召回,分别。此外,我们还期间和 #MeToo运动后采用的模式。一些有趣的研究结果发现这是不是从一个粗浅的分析容易辨认。
利用空腔方法研究有向控制集问题:警告传播和人口动态
原文标题: The Directed Dominating Set problem studied by cavity method: Warning propagation and population dynamics
地址: http://arxiv.org/abs/1911.06974
作者: Yusupjan Habibulla
摘要: 对于有向图(有向图)的最小支配集是一个典型的硬组合优化问题。在以前的文章中,我们曾用腔方法这个问题。虽然我们找到了一个给定的图,使该极小支配尺寸的很好估计的解决方案,我们进一步发展了一步副本对称性破缺理论,确定无向极小支配集问题的基态能量。对于无向最小支配集问题的解决方案显示出空间既缩合过渡和定期随机图群集变迁。我们还开发了无向的Erd ħö S-R '恩义图的零点温度测量传播算法来查找的基态能量。在本文中,我们继续发展的一步副本对称性破缺理论找到有向极小支配集问题的基态能量。我们发现如下。 (1)当连接性大于3.704芯渗滤阈值的警告传播方程不能收敛。正面的边有两种类型的警告,但负面的边有一个。 (2)我们确定的基态能量和一个Erd ħö S-R '恩义随机图的转变点。 (3)调查传播抽选算法具有与置信传播算法的抽取可比良好的结果。关键词:有向最小支配集,复制品对称性破坏,的Erd ħö S-R '恩义图表,警告传播,调查传播抽取。
随机网络SIRS模型自我持续振荡的涌现
原文标题: Emergence of Self-Sustained Oscillations for SIRS Model on Random Networks
地址: http://arxiv.org/abs/1911.07031
作者: Mohammed Ali Saif
摘要: 我们研究从持久阶段灭绝相的相变的SIRS(易感/感染/难治/敏感)的疾病随机网络上传播的模式。通过研究时空演变和随机网络这种模式的同步参数,我们发现,在随机网络,节目在一个狭窄的范围内聚集系数的数值非常小的同步阶段这种模式。这一发现证实了文献中得出的结论。 [4],聚类系数是负责同步阶段中的小世界网络的出现。
小世界网络SIRS模型临界阈值
原文标题: Critical Threshold For SIRS Model on Small World Networks
地址: http://arxiv.org/abs/1911.07035
作者: Mohammed Ali Saif
摘要: 我们研究从持久阶段为SIRS(易感/感染/难治/敏感)的疾病,小世界网络上传播模型灭绝相的相变。我们显示出与小世界网络这个模型相关联的所有参数的影响,我们创建完整的相空间。我们获得的结果是与在参考文献获得的那些相一致。[7]在该网络的病症的有限值从一个波动特有状态到在感染亚群的大小自持振荡的相转变的存在方面。而且我们的研究结果宣称,这一转变发生特别在平均集群化转变,从高至低。聚类系数对SIRS模型在网络上的影响可以从参考文献中获得的结果来理解。 [9],其表示现有的环网络中,为了该疾病在整个网络的节点频繁传播的重要性。其中,集群往往传播感染紧密的社区之一。因此,当环是在网络内部高,再感染发生了网络在许多地方和在不同的时间,它看起来像在发生感染的第二时间段的一种随机性。当循环的次数是低反之,再感染发生在特定的地点和时间在网络上,它看起来像在发生感染的第二个时期是一种规律性的。
通过时空交互挖掘大型在线社会网络取关行为
原文标题: Mining Unfollow Behavior in Large-Scale Online Social Networks via Spatial-Temporal Interaction
地址: http://arxiv.org/abs/1911.07156
作者: Haozhe Wu, Zhiyuan Hu, Jia Jia, Yaohua Bu, Xiangnan He, Tat-Seng Chua
摘要: 跟踪和取消关注,这分别表示关系建立和关系解散:在线社会网络(的OSN)通过两个普遍的行为的发展。社会网络演进的研究主要集中在后续的行为,而取消关注行为已很大程度上被忽略了。矿业取消关注行为是困难的,因为用户对取消关注决策不仅受到像信息量和互惠用户属性的简单组合的影响,而且也受它们之间的复杂的相互作用。同时,之前的数据集很少包含推断这种复杂的相互作用足够的纪录。为了解决这些问题,我们首先构建一个大型的真实世界的微博数据集,记录详细的180万个中国用户的帖子的内容和关系的动态。接下来,我们定义用户的属性为两大类:空间属性(例如,用户的社会角色)和时间属性(例如,用户帖子的内容)。利用构建的数据集中,系统地研究用户的时间和空间属性之间的相互影响如何有助于取消关注行为。然后,我们提出有用于取消追踪预测异构信息(UMHI)一种新颖的统一模型。具体地,我们的模型UMHI:1)捕获通过社会网络结构用户的空间属性; 2)通过推断用户张贴的内容,并取消关注历史用户的时间属性;和3)由非线性MLP层模型的空间和时间属性之间的相互作用。在构建数据集综合评价表明,该UMHI模型优于基准方法,通过对平均16.44%的精确性方面。此外,性因素分析确认两个空间属性和时间属性是挖掘取消关注行为至关重要。
社交媒体谣言检测:数据集、方法和机会
原文标题: Rumor Detection on Social Media: Datasets, Methods and Opportunities
地址: http://arxiv.org/abs/1911.07199
作者: Quanzhi Li, Qiong Zhang, Luo Si, Yingchi Liu
摘要: 社会化媒体平台已经被用于信息和新闻采访,他们在许多应用中非常有价值的。然而,他们也导致谣言和假新闻的传播。已经采取了许多努力,探测并通过分析其内容,并使用机器学习技术的社会背景下揭穿社交媒体上的传言。本文给出了传闻中检测领域的最新研究的概况。它提供了用于检测传闻数据集,并审查基础上,他们开发什么类型的信息和他们采取接近重要研究的完整列表。更重要的是,我们也为今后的研究目前一些新的方向。
通过基于注意力的多任务跨媒体维度建模理解教学风格
原文标题: Understanding the Teaching Styles by an Attention based Multi-task Cross-media Dimensional modelling
地址: http://arxiv.org/abs/1911.07253
作者: Suping Zhou, Jia Jia, Yufeng Yin, Xiang Li, Yang Yao, Ying Zhang, Zeyang Ye, Kehua Lei, Yan Huang, Jialie Shen
摘要: 教学风格在帮助学生取得学业成功的重要作用。在本文中,我们探讨的有效了解教师的教学风格的新问题。具体地,我们研究1)如何定量地表征各种教师教学样式各种教师和2)如何建模跨媒体教相关的数据(语音,面部表情和身体动作,内容等人)和教学之间的微妙关系样式。使用由教育企业,一个新的概念叫教学风格语义空间提供了超过10000份的反馈问卷中选择的形容词(TSSS)的基础上的快感觉醒维理论来描述定量和全面的教学风格十分发达。然后,多任务深学习基于模型,基于注意机制的多路多任务深层神经网络(AMMDNN),提出准确和稳健捕捉跨媒体功能和TSSS之间的内在关系。基于基准数据集,我们进一步发展,包括4541全标注的跨模态教学班一个全面的数据集。我们的实验结果表明,所提出的AMMDNN性能优于(0.0842在平均的一致性相关系数(CCC)而言)基线的方法。为了进一步证明了该TSSS和我们模型的优势,一些有趣的案例研究进行的,如不同的老师和课程中教学方式比较,并利用教学质量分析所提出的方法。
用穿戴式传感器检测拥挤社会场景的F-结构和角色:使用LSTMs结合空间关系学和动力学
原文标题: Detecting F-formations & Roles in Crowded Social Scenes with Wearables: Combining Proxemics & Dynamics using LSTMs
地址: http://arxiv.org/abs/1911.07279
作者: Alessio Rosatelli, Ekin Gedik, Hayley Hung
摘要: 在本文中,我们研究了自动识别个对话组,或所谓的F-编队利用空间关系学和动力学。更正式地说,我们的目标自动识别可穿戴式传感器数据从2人未来是否表示F-形成成员。我们还探讨了联合检测成员和与他们的谈话(即扬声器或听众)采取的角色对的详细描述信息的问题。我们共同建模使用通过每人单个可穿戴式传感器获得的二进制的接近度和加速度空间关系学和动力学的概念。我们测试的这是在现实生活采风活动收集到的可公开获得的数据集MatchNMingle方法。我们独立显著优于他们发现这两种方式进行的是融合,提供0.975的AUC均采用30秒的窗口数据时。此外,我们的调查角色的检测显示,每对角色需要精确检测不同的时间分辨率。
通过卷积神经网络学习复杂网络传染病阈值
原文标题: Learning epidemic threshold in complex networks by Convolutional Neural Network
地址: http://arxiv.org/abs/1911.07281
作者: Qi Ni, Jie Kang, Ming Tang, Ying Liu, Yong Zou
摘要: 深度学习参加了比赛,因为不久前学习和识别的物理系统相变等多体量子系统,其基本晶格结构一般规律,因为他们是在欧氏空间。 Real Networks公司具有在动力在其中发挥作用显著复杂的结构特点,并由此复杂网络的结构和动力学信息不能直接通过现有的神经网络模型的经验教训。在这里,我们提出一种新颖且有效的架构相结合,结构和动力学信息到学习过程来学习复杂的网络流行阈值。考虑到欧氏空间中学习的强劲表现,卷积神经网络(CNN)的使用,并与困惑方案的帮助下,我们可以精确识别的流行动态的爆发阈值。以表示为CNN欧几里德空间中的高维网络的数据集,我们通过使用图表示学习算法减少网络的维数和离散嵌入空间以将其转换成图像状结构。然后,我们创造性地通过多通道图像的结构嵌入合并节点的动态状态。通过这种方式,该模型可以借鉴结构和动态信息的结论。大量模拟表明在合成的和经验网络数据集很大的性能。我们的终端到终端的机器学习框架是强大和普遍适用于具有任意大小和拓扑结构复杂的网络。
使用层依赖重要性抽样训练深度大型图卷积网络
原文标题: Layer-Dependent Importance Sampling for Training Deep and Large Graph Convolutional Networks
地址: http://arxiv.org/abs/1911.07323
作者: Difan Zou, Ziniu Hu, Yewen Wang, Song Jiang, Yizhou Sun, Quanquan Gu
摘要: 图卷积网络(GCNs)最近收到广泛的关注,因为它们在不同的图任务和不同领域的成功应用。对于大型图培训GCNs,但是,仍然是一个挑战。原始全批次GCN训练需要计算在每GCN层的曲线,这使以高的计算和存储器成本的所有节点的表示。为了缓解这一问题,一些基于采样的方法被提出来训练上的节点的子集GCNs。其中,节点明智邻居采样方法递归样品固定数目的邻居节点,并且从指数生长邻居尺寸从而其计算成本患有;而逐层重要性采样方法丢弃该邻居依赖性的限制,并且因此跨层采样的节点从稀疏连接问题的困扰。为了解决上述两个问题,我们提出了所谓的层依赖的重要性采样(LADIES)一种新的有效采样算法。基于在上层采样节点上,女士们选择他们的邻居节点,构建二分子图,并相应地计算的重要性概率。然后,样品固定数目由所计算出的概率的节点,并递归地每一层进行这样的程序来构造整个计算图。我们从理论和实验证明,我们提出的抽样算法优于在时间和存储成本方面先前的抽样方法。此外,女士们被证明具有较好的泛化精度比原有全批GCN,由于其随机性。
二阶模型的麻烦,或如何用一阶模型产生停停走走的交通
原文标题: The trouble with 2nd order models or how to generate stop-and-go traffic in a 1st order model
地址: http://arxiv.org/abs/1911.07547
作者: Jakob Cordes, Andreas Schadschneider, Antoine Tordeux
摘要: 行人动力学的经典二阶模型,如社会力模型,从动态,例如各种不切实际的行为遭受向后运动,振动和行人的重叠。这些影响是不相关的运动方程的离散化,但内在的动力。他们是通常出现在二阶模型强大的惯性作用的结果。我们发现,实验观察到的停止和去的行为,这是任何行人模型的一个重要试验,可以用随机一阶模型不从强大的惯性所产生的动力文物遭受转载。该模型提供了一种基于相关噪声的停止和去行为的新机制。
随机游走应用于假冒账号检测问题:一种混合方法
原文标题: An Application of Random Walk on Fake Account Detection Problem: A Hybrid Approach
地址: http://arxiv.org/abs/1911.07609
作者: Ngoc C. Lê, Manh-Tuan Dao, Hoang-Linh Nguyen, Tuyet-Nhi Nguyen, Hue Vu
摘要: 社会网络在当今的世界上显著的作用。社会网络的重要性,例如Facebook或Twitter,是不可否认的。然而,他们也有很多问题。其中之一是打击假冒账户防御机制的必要性。这显然不是一个简单的任务,从正宗的那些独立的假帐户。在本文中,我们提出了一个排序方案,既包括基于图和基于特征的方法,以帮助假冒Facebook个人主页进行检测。利用支持向量机(SVM) 引用 cortes1995和SybilWalk 引用 JWZ17,型号超过设定的数万越南的Facebook账户来实现高精确度。
当巧合具有意义:通过信息令牌复发网络理解涌现
原文标题: When Coincidence has Meaning: Understanding Emergence Through Networks of Information Token Recurrence
地址: http://arxiv.org/abs/1911.07642
作者: Markus Luczak-Roesch
摘要: 我在本文中概念化为具有不一定是观察到的因果关系的事件之间捕获的巧合的新方法。建立在先验信息瀑布的方法,我概括罕见的微观层面的事件和宏观层面的制度变迁之间的相互作用的张量理论。后来,我讨论一些被用于实践这里列出的理论假设的验证希望的候选应用领域。这是寻求打下基础,以发现对一个复杂系统的宏观状态的可衡量的影响,因此被认为是有意义的巧合普遍数学性质的初步工作。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。