- 在线观看活动中的双重诱导多重分形;
- 具有有限种子比例的传染病模型中的感染突然传播;
- 集体智慧构建主题分类体系;
- 表征Twitter中的互连和语言模式;
- QDEE:社区问答网站中的问题难度和专业性估计;
- 通过线性规划进行链路预测;
- 作为真实金融复杂系统中社会行为一部分的缺失数据;
- 长程二维谢林自旋系统的演化与稳态;
- 分析和描述WhatsApp公共团体的政治讨论;
- 在阳光的阴影下:表征在线社会网络中垃圾邮件活动滥用的电话号码;
- 文化的传播的对称群和Axelrod模型;
在线观看活动中的双重诱导多重分形
原文标题: Dual-induced multifractality in online viewing activity
地址: http://arxiv.org/abs/1411.4840
作者: Yu-Hao Qin, Zhi-Dan Zhao, Shi-Min Cai, Liang Gao, H. Eugene Stanley
摘要: 尽管最近的研究发现人类活动中存在与事件间时间的胖尾分布有关的长期相关性,并且这些相关性表明分形的存在,但分形的性质及其起源尚未被分析。我们同时使用DFA和MFDFA来分析从Movielens和Netflix分离的在线观看活动中的时间序列。我们发现个人和社区层面的长期相关性,并且个体层面的相关程度取决于活动层面。这些长期相关性也表明在线观看模式存在分形。而且,我们首先发现多重分形是由事件间时间的胖尾分布(即个体的连续观看行为之间的时间)和在线观看活动中的长期相关性的综合效应产生的,并验证了这一发现使用三个合成系列。因此,可以得出结论:在线观看活动中的多重分形是由事件间时间的胖尾分布和长期相关性共同造成的,并且这扩大了人类活动的通用属性,不仅包括物理空间,还有网络空间。
具有有限种子比例的传染病模型中的感染突然传播
原文标题: Sudden spreading of infections in an epidemic model with a finite seed fraction
地址: http://arxiv.org/abs/1611.02809
作者: Takehisa Hasegawa, Koji Nemoto
摘要: 我们研究了一个简单的病例,在一个流行病从最初感染节点(种子)的有限部分开始的情况下,在常规随机图中的易感染 - 弱感染 - 去除模型。先前的研究已经表明,假设单个种子,该模型在感染率的某个值处呈现出一种不连续的转变。进行蒙特卡洛模拟和评估近似主方程,我们发现当前模型对于具有有限种子分数的情况具有两个关键感染率。在第一临界速率下,系统显示由去除的节点组成的群集的渗透过渡,并且在第二临界速率大于第一临界速率时,巨型群集突然增长,并且即使它已经上升, 。主方程的数值评估表明,如果底层网络的程度较大且种子分数较小,则会出现这种突然的疫情扩散。
集体智慧构建主题分类体系
原文标题: Building-up the subject classification system from the collective intelligence
地址: http://arxiv.org/abs/1804.00026
作者: Jisung Yoon, Jinhyuk Yun, Woo-Sung Jung
摘要: 系统化主题分类对资助和评估科学项目至关重要。传统上,分类方案建立在专家组的经验知识上;因此专家的观点影响了目前的科学分类体系。这些系统在实践中归档了当前的最新技术水平,但是随着时间的推移,科学周转速度加快,因此加速的全球效应使得专家无法对分类系统的更新做出反应。为了克服上述限制,我们提出了一个利用集体知识的无偏分类方案,维基百科是一个由数百万用户编辑的互联网百科全书,以集体时尚的方式进行即时分类。我们为科学学科构建维基百科网络并提取网络的骨干。这种结构展示了基于集体智慧的科学和技术格局,这种集体智能比传统分类更无偏见和适应性强。
表征Twitter中的互连和语言模式
原文标题: Characterizing Interconnections and Linguistic Patterns in Twitter
地址: http://arxiv.org/abs/1804.00084
作者: Johnnatan Messias
摘要: 社交媒体被认为是一个民主空间,人们无论其性别,种族或任何其他人口方面都可以互相联系和互动。尽管在社交媒体中探索人口统计方面进行了大量努力,但社交媒体是否使离线世界的旧不平等永久存在尚不清楚。在本文中,我们尝试使用Face ++的高级图像处理算法来识别位于美国的Twitter用户的性别和种族。我们调查不同的人口群体如何相互联系并区分他们的语言风格和兴趣。我们量化了一个群体在多大程度上遵循并相互作用,以及这些连接和互动在Twitter中的不平等程度如何反映。我们还从六个类别(情感属性,认知属性,词汇密度和意识,时间参考,社交和个人关注以及人际关注)中提取语言特征,以确定他们在Twitter中分享的信息的相似性和差异。此外,我们提取人口组之间顶级短语的绝对排名差异。作为多样性的一个维度,我们使用从每个用户检索的感兴趣的主题。我们的分析表明,在Twitter中,被识别为白人和男性的用户在其他用户列表中的追随者数量和次数方面往往会达到更高的职位。不同人口群体在性别和种族领域以及感兴趣的话题中的写作方式存在明显差异。我们希望我们的努力能够刺激在线领域新的人口信息论的发展。最后,我们开发了一个基于Web的系统,利用用户的人口特征为Twitter趋势主题系统提供透明度。
QDEE:社区问答网站中的问题难度和专业性估计
原文标题: QDEE: Question Difficulty and Expertise Estimation in Community Question Answering Sites
地址: http://arxiv.org/abs/1804.00109
作者: Jiankai Sun, Sobhan Moosavi, Rajiv Ramnath, Srinivasan Parthasarathy
摘要: 在本文中,我们提出了社区问答网站(CQA)中的问题难度和专业技能估计(QDEE)框架,如Yahoo!答案和堆栈溢出,解决了众包中的根本挑战:如何适当地发送问题并将问题分配给具有适当专业知识的用户。这个问题领域一直是许多研究的主题,包括语言不可知以及有语言意识的解决方案。我们带来了一个关键的语言不可知论的洞察力:用户获得专业知识,因此倾向于随着时间的推移回答更多难题。我们在流行的竞争(有向)图模型中使用这种洞察力,通过识别所述模型中的关键分层结构来估计问题难度和用户专业知识。这里一个重要和新颖的贡献是对这个问题领域的“社会痛苦”的应用。通过使用我们的QDEE框架和其他文本特征来估计新发布的问题难度(冷启动问题)。我们还提出了一个模型,根据问题的难易程度和用户的专业知识,将新发布的问题发送给适当的用户。对现实世界CQA进行大量实验,例如Yahoo!答案和堆栈溢出数据证明了我们的方法相对于当代最先进的模型的改进的功效。 QDEE框架还允许我们通过识别不同用户在这些CQA中发挥的有趣模式和角色,以新颖的方式表征用户专业知识。
通过线性规划进行链路预测
原文标题: Link prediction via linear optimization
地址: http://arxiv.org/abs/1804.00124
作者: Ratha Pech, Dong Hao, Yan-Li Lee, Ye Yuan, Tao Zhou
摘要: 链路预测是网络科学面临的一个基本挑战,网络科学已经在指导实验室实验,挖掘药物靶点,推荐社会网络中的朋友,探测网络演化机制等方面发挥了应用的作用。通过一个简单的假设,即两个节点之间链接存在的可能性可以通过相邻节点贡献的线性累加来展开,我们获得最优似然矩阵的解析解,其显示出在预测缺失链接方面的性能明显好于最先进的算法不仅适用于简单网络,而且适用于加权和有向网络。令我们惊讶的是,即使是来自解决方案的一些退化的局部相似性指数也超过了众所周知的局部指数,这在很大程度上提高了我们的知识,例如,两个节点之间的3跳路径的数量的直接计数更准确地预测缺失的链路2跳路径的数量(即共同邻居的数量),而在以前的研究中,如本地路径指数和Katz指数所表明的,对于较长路径的统计总是被认为是互补的,但不如那些在较短的路径上重要。
作为真实金融复杂系统中社会行为一部分的缺失数据
原文标题: Missing Data as Part of the Social Behavior in Real-World Financial Complex Systems
地址: http://arxiv.org/abs/1804.00240
作者: Guy Kelman, Eran Manes, Marco Lamieri, David Breé
摘要: 已知许多现实世界的网络展示的事实与我们在网络创建和通信模式理论中规定的知识相抵触。网络分析的一个常见先决条件是节点和链路上的信息将会完整,因为网络拓扑结构对缺少这种信息非常敏感。因此,许多现实世界的网络在随机抽样下不能满足这个标准可能会被丢弃。在本文中,我们提供了一个框架来解释网络数据中的缺失观测值,假设这些观测值不是随机丢失的。我们用一个金融交易网络的案例研究来展示方法论,其中代理人对自利观察者的数据收集程序的意识可能会导致战略泄露或信息隐瞒。尽管可能性是网络生成过程的一个重要特征,但非随机缺失却被忽视。分析表明,在复杂系统中,战略信息扣留可能是一个有效的普遍现象。证据足以支持有影响力的观察者的存在,并为创建网络提供引人注目的动态机制。
长程二维谢林自旋系统的演化与稳态
原文标题: Evolution and Steady State of a Long-Range Two-Dimensional Schelling Spin System
地址: http://arxiv.org/abs/1804.00358
作者: Hamed Omidvar, Massimo Franceschetti
摘要: 我们考虑一个长程相互作用的粒子系统,其中二进制粒子位于平坦环面的整数点处。基于与其“邻居”中的其他粒子的相互作用以及常见不容忍阈值$ \ t $的值,每个粒子决定是否在独立和按指数分布的等待时间之后改变其状态。这相当于开放系统中自组织隔离的Schelling模型,具有Glauber动力学的零温度Ising模型或具有扩展的Moore邻域的异步元胞自动机(ACA)。我们首先在过程动力学中证明了“受影响”节点扩散的形状定理。第二,我们证明当进程停止时,对于所有$ {\ tau \ *(\ tau ^ *,1- \ tau ^ *)\ setminus \ {1/2 }}大约0.488} $,并且当相互作用邻域的大小$ N $足够大时,每个粒子几乎可以肯定地包含在一个大小指数为$ N $的大“单色区域”中。当粒子被放置在无限格子$ \ mathbb {Z} ^ 2 $上而不是平坦圆环上时,对于上面提到的$ \ tau $的值,足够大$ N $,并且在足够长的演化时间之后,每个几乎可以肯定地,粒子被包含在一个尺寸指数为$ N $的大单色区域中。
分析和描述WhatsApp公共团体的政治讨论
原文标题: Analyzing and characterizing political discussions in WhatsApp public groups
地址: http://arxiv.org/abs/1804.00397
作者: Josemar Alves Caetano, Jaqueline Faria de Oliveira, Helder Seixas Lima, Humberto T. Marques-Neto, Gabriel Magno, Wagner Meira Jr, Virgílio A. F. Almeida
摘要: 我们详细描述了我们认为是WhatsApp在科学文献中对群体行为的首次重要分析。我们定义了超过270,000条消息和跨越28天期限的约7,000名用户,分为三个不同的层次。消息层重点关注单个消息,每个消息都是由用户执行的特定帖子的结果。用户层在与组交互时表征用户操作。组图层表征参与组的所有用户的聚合消息模式。我们分析了WhatsApp中的81个公共团体,并根据与每个团体相关的关键词将他们分为两类,即政治团体和非政治团体。我们的贡献是双重的。首先,我们引入一个框架和一些度量标准来描述移动消息系统(如WhatsApp)中通信组的行为。其次,我们的分析强调了政治团体中用户消息的类似Zipf的配置文件。另外,我们的分析显示Whatsapp消息是多媒体,结合了不同形式的内容。多媒体内容(即音频,图像和视频)和表情符号分别占所有消息的20%和11.2%。政治团体比非政治团体使用更多的短信。其次,我们描述了代表公共团体行为的新颖特征,在关键成员之间进行了多次会话转换,并由团队中的其他成员参与。
在阳光的阴影下:表征在线社会网络中垃圾邮件活动滥用的电话号码
原文标题: Under the Shadow of Sunshine: Characterizing Spam Campaigns Abusing Phone Numbers Across Online Social Networks
地址: http://arxiv.org/abs/1804.00451
作者: Srishti Gupta, Dhruv Kuchhal, Payas Gupta, Mustaque Ahamad, Manish Gupta, Ponnurangam Kumaraguru
摘要: 网络犯罪分子滥用在线社会网络(OSN)将受害者吸引到各种垃圾邮件中。在不同的垃圾邮件类型中,较少探索的领域是利用电话渠道欺骗用户的OSN滥用。电话号码通过OSN广告,用户被骗入这些号码。为了扩大此类诈骗/垃圾邮件广告系列的覆盖范围,电话号码在Facebook,Twitter,GooglePlus,Flickr和YouTube等多个平台上进行广告宣传。在本白皮书中,我们介绍了第一个数据驱动的跨平台活动特征,该活动使用多个OSN平台访问受害者并使用电话号码进行获利。我们在六个月的时间内收集了来自Twitter,Facebook,GooglePlus,Youtube和Flickr的包含1.8M独特电话号码的2300个帖子。将这些帖子集中在一起,有助于我们识别202个在全球运营的活动,其中印度尼西亚,美国,印度和阿拉伯联合酋长国是最重要的发起人。我们发现,尽管印度尼西亚的活动产生了最高的数量(320万个帖子),但迄今为止只有1.6%的宣传印尼活动的帐户已被暂停。通过检查在多个OSN上运行的广告系列,我们发现Twitter比Facebook检测并暂停93%的帐户。因此,跨OSN共享有关与滥用相关的用户帐户的情报可以帮助进行垃圾邮件检测。根据我们的数据,如果在OSN上分享情报,可以节省大约35,000名受害者和8,800万美元。通过分析在OSN上运行的基于电话号码的垃圾邮件活动,我们强调了在OSN上出现的各种基于电话的攻击。
文化的传播的对称群和Axelrod模型
原文标题: Symmetric group and the Axelrod model for dissemination of cultures
地址: http://arxiv.org/abs/1804.00510
作者: Nirina Maurice Hasina Tahiridimbisoa, Yabebal Tadesse
摘要: 我们考虑Axelrod提出的用于在2维平方格上传播文化的模型。我们从分析的角度审视这个模型。我们定义$ \ left \ langle(t)\ right \ rangle $来量化社会中$ t $时间的可能文化配置。该模型的典型初始培养配置被表征。运动方程根据$ \ left \ langle s(t)\ right \ rangle $得出。我们研究这个Axelrod系统向其培养配置平衡的发展图。一般来说,我们观察到这个模型经历了三个发展阶段。我们对这三个不同的发展阶段给出了一个量化的解释。跟上这个Axelrod模型,我们将其文化配置空间表征为$ \ left \ langle s(t _ {\ text {eq}})\ right \ rangle = 1 $。这个空间被称为单养空间。理解这个空间等同于限制模型中一个人的文化配置空间。这个单独的文化空间被识别为空间$ V_N ^ {\ otimes F} $达到同构。考虑置换组$ S_N $在空间$ V_ {N} ^ {\ otimes F} $上的行为。在这个动作下,可观察的$ \ left \ langle(t)\ right \ rangle $是Axelrod系统的一个不变量。我们探索这种对称性,并对组成单一文化空间的不同的文化配置类别进行分类。为了实现这一点,我们考虑$ N \ geq F $的情况。我们从组表示理论提出技术来执行这种分类。不同等级的文化配置由与贝尔号$ B_F $相关的Dickau图索引。一个具体的例子$ F = 4 $和$ N \ geq 4 $被认为是对我们分析的完整说明。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。