- 是或否,你怎么看?加泰罗尼亚独立与社交媒体上的语言认同;
- 挖掘表情符号使用模式与人格的关系;
- 用于检测在Twitter上使用僵尸网络的垃圾信息活动的无监督方法;
- 城市霾和光伏;
- FSCNMF:通过非负矩阵分解融合结构和内容以嵌入信息网络;
- Switch 2.0:规划高可再生电力系统的现代平台;
- 多功能产品竞争性多渠道营销的整合框架;
- 伦敦自行车共享网络中的社区结构、互动和动态;
- 基于Levenshtein距离的多维主观旅游信息图像相似度克隆选择算法及交互式GHSOM发现隐藏点;
- 意见分歧揭示了网络社区结构的复杂性;
- 极端主义暴力对线上仇恨言论的影响;
- 现在该来点完全不同的东西了:在线设计师网络中的视觉新奇性;
- 涌现于多个流言级联的重复用户网络;
- DyLink2Vec:动态网络中链路预测的有效特征表示;
- 用于学习节点潜在表示的演化网络中时间平滑的模型;
是或否,你怎么看?加泰罗尼亚独立与社交媒体上的语言认同
原文标题: S'i o no、 qu`e penses? Catalonian Independence and Linguistic Identity on Social Media
地址: http://arxiv.org/abs/1804.05088
作者: Ian Stewart, Yuval Pinter, Jacob Eisenstein
摘要: 政治认同往往表现在语言变异中,但从定量的角度来看,两者之间的关系仍然相对尚未探索。本研究通过Twitter在与2017年独立公民投票有关的话语中考察了加泰罗尼亚语在西班牙加泰罗尼亚半自治地区的使用情况。我们证实了先前的发现,即赞成独立推文比反独立推文更可能包含当地语言。我们还发现加泰罗尼亚语在与公民投票有关的话语中比其他语境更频繁地使用,这与之前关于语言变异的发现相反。这表明加泰罗尼亚语在表达加泰罗尼亚政治身份方面发挥了强有力的作用。
挖掘表情符号使用模式与人格的关系
原文标题: Mining the Relationship between Emoji Usage Patterns and Personality
地址: http://arxiv.org/abs/1804.05143
作者: Weijian Li, Yuxiao Chen, Tianran Hu, Jiebo Luo
摘要: 表情符号已被广泛用于文本交流,作为传达非语言线索的新方式。一个有趣的观察是不同用户之间的各种表情符号使用模式。在本文中,我们调查了用户人格特征与他们的表情符号使用模式之间的相关性,特别是总体数量和具体偏好。为了实现这一目标,我们构建了一个大型Twitter数据集,其中包括352,245名用户和超过11.3亿次与计算出的人格特征和表情符号使用模式相关的推文。我们的相关性和表情符号预测结果提供了对导致各种表情符号使用模式以及其在表情符号推荐任务中的潜力的不同个性的力量的洞察力。
用于检测在Twitter上使用僵尸网络的垃圾信息活动的无监督方法
原文标题: An Unsupervised Approach to Detect Spam Campaigns that Use Botnets on Twitter
地址: http://arxiv.org/abs/1804.05232
作者: Zhouhan Chen, Devika Subramanian
摘要: 近年来,Twitter发现了大量自动化帐户或僵尸程序,它们发送垃圾邮件,提供clickbait,利用恶意软件危害安全性,并试图歪曲公众舆论。之前的研究估计,大约9%至17%的Twitter账户是博客中的16%至56%的推文贡献者。本文介绍了一种无监督的方法来实时检测Twitter垃圾邮件活动。我们侦测到的僵尸群组会在延长的时间段内使用缩短的嵌入网址发布重复内容。我们使用检测协议进行的实验表明,僵尸工具始终占Twitter上7个流行URL缩短服务生成的推文的10%至50%。更重要的是,我们发现使用缩短网址的漫游器可以连接到控制数千个域的大规模垃圾邮件活动。似乎有两种不同的机制用于控制bot组,我们在本文中对两者进行了调查。我们的检测系统24/7全天候运行,并积极收集涉及垃圾邮件活动的机器人,并将其添加到不断发展的恶意机器人数据库中。我们通过REST API将检测到的僵尸工具的数据库用于查询,以便其他人可以过滤来自恶意机器人的推文,以获取高质量的Twitter数据集进行分析。
城市霾和光伏
原文标题: Urban Haze and Photovoltaics
地址: http://arxiv.org/abs/1804.05249
作者: I. M. Peters, S. Karthik, L. Haohui, T. Buonassisi, A. Nobre
摘要: 城市霾是一个多方面的威胁。首先是重大的健康危害,它也会影响光线通过低层大气。在本文中,我们提出了一项研究,讨论霾对城市光伏设施性能的影响。使用来自德里和新加坡的长期高分辨率现场数据,我们推导出日射减少与细颗粒物质(PM2.5)浓度之间的经验关系。这种方法可以直接估算地球上任何地方光伏发电对空气污染造成的损失。对于德里,我们发现由于空气污染,2016年至2017年期间,由硅光伏电池板接收的日照减少了11.5%,每年减少1.5%或200千瓦时/平方米。我们将此分析扩展到全球16个城市,并估计日照减少幅度从2.0%(新加坡)到9.1%(北京)。使用来自新加坡的谱数据,我们预测其他光伏技术将如何受到影响,并发现与硅相比,砷化镓相对于GaAs增加23%,而1.64 eV钙钛矿材料则增加42%。考虑到目前的电力安装目标和当地电力价格,我们预计仅德里光电设备的年度收入损失就可能超过2000万美元,这表明空气污染对光伏站点运营商和全球投资者的年度经济损失可能达到数十亿美元。
FSCNMF:通过非负矩阵分解融合结构和内容以嵌入信息网络
原文标题: FSCNMF: Fusing Structure and Content via Non-negative Matrix Factorization for Embedding Information Networks
地址: http://arxiv.org/abs/1804.05313
作者: Sambaran Bandyopadhyay, Harsh Kara, Aswin Kannan, M N Murty
摘要: 网络嵌入在过去几年中一直是信息网络挖掘的核心话题。网络嵌入为网络的每个节点学习紧凑的低维矢量表示,并将这种低维表示用于不同的机器学习和挖掘应用。现有的网络嵌入方法主要考虑网络的结构。但是,许多真实世界的网络还包含丰富的文本或与每个节点相关的其他类型的内容,这可以帮助理解网络的基础语义。将各个节点的内容集成到最先进的网络嵌入方法中并不简单。在这项工作中,我们提出了一个基于非负矩阵分解的优化框架,即FSCNMF,它考虑网络结构和节点内容,同时学习网络中每个节点的低维向量表示。我们的方法系统地利用网络结构和节点内容的一致性。我们进一步将基本的FSCNMF扩展为高级方法,即FSCNMF ++来捕获网络中的高阶近似值。我们针对不同类型的机器学习应用(如节点聚类,可视化和多类分类)在现实世界的信息网络上进行实验。结果表明,我们的方法可以比最先进的算法更好地表示网络,并提高我们考虑的所有应用程序的性能。
Switch 2.0:规划高可再生电力系统的现代平台
原文标题: Switch 2.0: A Modern Platform for Planning High-Renewable Power Systems
地址: http://arxiv.org/abs/1804.05481
作者: Josiah Johnston, Benjamín Maluenda, Rodrigo Henríquez, Matthias Fripp
摘要: 本文描述了Switch 2.0,这是一个用于规划向低排放电力电网转型的开源模型平台,旨在满足21世纪的电网规划要求。 Switch能够对传统或智能电网的投资和运营进行长期,中期和短期规划,整合大量可再生能源,存储和/或需求响应。应用包括综合资源规划,投资规划,经济和政策分析以及基础研究。潜在用户包括研究人员,教育工作者,行业和监管机构。 Switch将生成和传输容量规划制定为混合整数线性规划,其中投资和运营在多个投资期间跨采样时间序列进行协同优化。冻结投资决策支持高分辨率生产成本建模,包括更长的时间序列和更多的操作细节。建模功能包括机组承诺,部分装载效率,计划和运营储备,燃料供应曲线,存储,水电网络,政策约束和需求响应。 Switch采用模块化架构,允许用户通过选择内置模块“点菜”或编写定制模块来灵活地组合模型。本文描述了Switch 2.0的软件架构和模型制定,并提供了一个案例研究,其中使用该模型来确定获得电池负载转移和预留服务以及100%可再生能源系统中的需求响应的最佳选择。
多功能产品竞争性多渠道营销的整合框架
原文标题: An Integrated Framework for Competitive Multi-channel Marketing of Multi-featured Products
地址: http://arxiv.org/abs/1804.05525
作者: Swapnil Dhamal
摘要: 对于任何公司而言,为了销售其产品,可以使用多种渠道接触人口。一些最知名的频道是(a)大众传媒广告,(b)使用社交广告的推荐,以及(c)使用社会网络的病毒式营销。该公司希望最大限度地扩大其影响力,同时也考虑竞争产品的同步营销,其中产品市场可能不是独立的。在这个方向上,我们提出并分析了经典线性阈值模型的多特征泛化。因此,我们制定了一个框架,将所考虑的营销渠道整合到社会网络中,并在这些渠道之间分配预算。
伦敦自行车共享网络中的社区结构、互动和动态
原文标题: Community structures、 interactions and dynamics in London's bicycle sharing network
地址: http://arxiv.org/abs/1804.05584
作者: Fernando Munoz-Mendez, Konstantin Klemmer, Ke Han, Stephen Jarvis
摘要: 自行车共享计划是交通系统,不仅在拥挤的城市地区提供有效的交通方式,而且还改善了与公共交通和当地交通的最后一英里连接。全球的自行车共享计划会生成具有空间和时间维度的详细行程数据集,通过适当的挖掘和分析,可以揭示有关城市移动模式的宝贵信息。在本文中,我们研究伦敦自行车共享数据集以探索社区结构。使用新颖的聚类技术,我们得出独特的行为模式并评估社区互动和时空动态。分析揭示了模拟伦敦物理结构的独立,互联和混合集群。随着时间的推移探索变化,我们发现地理上孤立和专业的社区相对一致,而其余系统呈现波动性,特别是在通勤高峰期间和周围。通过提高对自行车共享用户集体行为的理解,本分析支持政策评估,运营决策以及促进基础设施设计和管理方面的改进。
基于Levenshtein距离的多维主观旅游信息图像相似度克隆选择算法及交互式GHSOM发现隐藏点
原文标题: A Clonal Selection Algorithm with Levenshtein Distance based Image Similarity in Multidimensional Subjective Tourist Information and Discovery of Cryptic Spots by Interactive GHSOM
地址: http://arxiv.org/abs/1804.05669
作者: Takumi Ichimura, Shin Kamada
摘要: 基于手机的参与式传感(MPPS)系统涉及一个用户社区,通过他们的手机发送个人信息并参与自主感知。感应数据也可以通过无线方式与手机进行通信的外部感应设备获得。我们开发的搭载Android智能手机的旅游主观数据采集系统可以确定过滤规则,提供旅游景点的重要信息。规则由Interactive Growing Hierarchical SOM自动生成。但是,没有生成与照片相关的过滤规则,因为不能从图像中提取指定的特征。我们提出Levenshtein距离的有效方法来推断图像视点的空间接近度,从而确定应该处理图像的指定图案。为了验证所提出的方法,本文采用交互式GHSOM和免疫记忆细胞克隆选择算法对主观数据进行图像分类。
意见分歧揭示了网络社区结构的复杂性
原文标题: Opinion Divergence Reveals the Complexity of Community Structure in Networks
地址: http://arxiv.org/abs/1804.05692
作者: Ren Ren, Jinliang Shao
摘要: 社区结构对现实世界(生物,社会,神经)网络的分析起着重要作用。对现实组织的观察表明,社区往往呈现层次结构和重叠结构。在这里,将主要DeGroot模型应用到网络的观点动态中,我们研究了代理商在达成共识方面的意见分歧,然后提出了一个强大而有效的同步框架来检测分层和重叠社区。提出的框架和获得的结果提出了一套模块化结构中层次结构和重叠的“功能定义”,其中首先报道了高度重叠的解释和必要性,为研究模块化网络的复杂性提供了参考。
极端主义暴力对线上仇恨言论的影响
原文标题: The Effect of Extremist Violence on Hateful Speech Online
地址: http://arxiv.org/abs/1804.05704
作者: Alexandra Olteanu, Carlos Castillo, Jeremy Boy, Kush R. Varshney
摘要: 在线用户生成内容受许多因素影响,其中包括内部因素,如平台可供性和规范,以及外生因素,特别是重大事件。这些影响用户说什么,他们如何说,以及他们说什么。在本文中,我们着重量化暴力事件对各种类型的仇恨言论的影响,无视攻击和贬损恐吓以及明确要求暴力。我们把这项研究作为一系列涉及西方国家的阿拉伯人和穆斯林作为肇事者或受害者的攻击的支柱,这些攻击已被新闻媒体广泛报道。这些攻击引发了围绕移民的围绕移民的激烈政策辩论,其中包括网络媒体,这些论坛遭到种族主义偏见和仇恨言论的伤害。我们的研究重点是在Twitter和Reddit两个社交媒体平台上模拟攻击对可恶言论的数量和类型的影响。除其他调查结果外,我们观察到极端主义暴力倾向于导致在线仇恨言论增加,特别是直接提倡暴力的言论。我们的研究对仇恨言论在线监控的方式提出了暗示,并且提出了可以争取的方式。
现在该来点完全不同的东西了:在线设计师网络中的视觉新奇性
原文标题: And Now for Something Completely Different: Visual Novelty in an Online Network of Designers
地址: http://arxiv.org/abs/1804.05705
作者: Johannes Wachs, Bálint Daróczy, Anikó Hannák, Katinka Páll, Christoph Riedl
摘要: 新颖性是创新的关键因素,但量化难度很大。对于平面设计等视觉工作尤其如此。使用专业数字设计师在线社会网络上共享的设计,我们使用统计学习方法来测量视觉新颖性,以将图像特征与之前创建的图像特征进行比较。然后,我们将社会网络的立场与设计师形象的新颖性联系起来。我们发现,在这个专业平台上,拥有密集本地网络的用户倾向于制作更多新颖但通常不太成功的图像,但有一些重要的例外。也就是说,在融合的本地网络中嵌入新颖图像的用户更为成功。
涌现于多个流言级联的重复用户网络
原文标题: Repetitive users network emerges from multiple rumor cascades
地址: http://arxiv.org/abs/1804.05711
作者: Daqing Li, Jiali Gao, Jichang Zhao, Zilong Zhao, Levy Orr, Shlomo Havlin
摘要: 谣言在网络社交媒体上传播,对后社会时代的社会构成重大威胁。假设特定的谣言传播是一个单一的事件网络并且忽略不同的谣言级联之间可能的相互依赖关系,已经致力于谣言识别和揭穿。在这里,我们研究了多个谣言的集体传播,并且令人惊讶地发现了一个反复参与不同谣言级联的用户网络。虽然这些重复使用的用户在单一传播网络层次上表现出较小的差异,但与新闻传播相比,他们被发现与多个流言级联形成了更加密集的协作网络。由重复性谣言传播者形成的集团式集群可以作为谣言识别和阻断谣言预防目标的高质量特征。我们的研究结果可以通过将多个谣言传播视为一个相互作用的谣言生态系统,提供对谣言传播的更好理解,并提出基于谣言传播历史的区分和缓解的新方法。
DyLink2Vec:动态网络中链路预测的有效特征表示
原文标题: DyLink2Vec: Effective Feature Representation for Link Prediction in Dynamic Networks
地址: http://arxiv.org/abs/1804.05755
作者: Mahmudur Rahman, Tanay Kumar Saha, Mohammad Al Hasan, Kevin S. Xu, Chandan K. Reddy
摘要: 可以通过理解随时间推移的链路出现和消失的模式来研究诸如社会网络或通信网络的复杂系统的时间动态。沿着这种理解的关键任务是预测在较早时间点的链路状态集合的未来时间网络的链路状态。在现有文献中,这个任务被称为动态网络中的链路预测。解决此任务比静态网络中的对手更难,因为对于动态网络来说节点对实例的有效特征表示很难获得。为了克服这个问题,我们提出了一种新的动态网络节点对实例嵌入的方法。所提出的方法将度量嵌入任务建模为最优编码问题,其中目标是最小化重构误差,并且其使用梯度下降方法来解决该优化任务。我们通过将它用于各种现实生活动态网络中的链路预测来验证所学习的特征表示的有效性。具体来说,我们表明,我们提出的链路预测模型,使用提取的特征表示的训练实例,胜过使用众所周知的链路预测功能的几种现有方法。
用于学习节点潜在表示的演化网络中时间平滑的模型
原文标题: Models for Capturing Temporal Smoothness in Evolving Networks for Learning Latent Representation of Nodes
地址: http://arxiv.org/abs/1804.05816
作者: Tanay Kumar Saha, Thomas Williams, Mohammad Al Hasan, Shafiq Joty, Nicholas K. Varberg
摘要: 在动态网络中,顶点的邻域在网络的不同瞬时快照之间演化。精确的时间演化建模可以帮助解决涉及现实生活中的社交和互动网络的复杂任务。然而,用于学习潜在表示的现有模型不足以以有意义的方式获得动态网络的不同时间戳的顶点的表示向量。在本文中,我们提出了动态网络的潜在表示学习模型,通过考虑两种不同的时间平滑性来克服上述限制:(i)改进的,和(ii)线性变换。改进后的模型随时间跟踪顶点的表示向量,有助于网络的基于顶点的时间分析。另一方面,基于线性变换的模型提供了一个平滑过渡算子,它将来自一个时间快照的所有顶点的表示向量映射到下一个(未观察到的)快照 - 这有助于预测未来时间戳中的网络状态。我们通过使用它们来解决时间链路预测任务来验证我们提出的模型的性能。对来自不同领域的9个实际网络进行的实验验证了所提出的模型明显优于用于预测演化网络的动态的现有模型。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。