- 基于集成发现网络中不相交,重叠和模糊的社区结构;
- 与分裂图相关的一类随机矩阵中的谱间隙的涌现;
- 识别地理标记Twitter消息中的数据噪声,用户偏差和系统错误;
- 线性和非线性市场相关性:表征金融危机和投资组合优化;
- 欧洲水电和北非太阳能在完全可再生的欧洲电力系统中的相互作用;
基于集成发现网络中不相交,重叠和模糊的社区结构
原文标题: Ensemble-Based Discovery of Disjoint, Overlapping and Fuzzy Community Structures in Networks
地址: http://arxiv.org/abs/1712.02370
作者: Tanmoy Chakraborty, Noseong Park
摘要: 尽管在数据挖掘中集成聚类方面做了大量的工作,但集成方法在网络社区检测中的应用还处于起步阶段。本文提出两种集合方法:ENDISCO和MEDOC。 ENDISCO执行不相交的社区检测。相比之下,MEDOC执行不相交,重叠和模糊社区检测,并代表了第一个模糊和重叠社区检测的集合方法。我们对这两种算法进行了广泛的实验,针对已知社区结构的合成和几个现实世界的数据集。我们展示ENDISCO和MEDOC都击败了最着名的现有独立社区检测算法(虽然我们强调他们利用它们)。在不相交的社区检测的情况下,我们展示ENDISCO和MEDOC都在多准确性度量和运行时方面击败现有的集合社区检测算法。我们进一步表明,我们的集成算法可以帮助探索网络社区的核心 - 边结构,在动态网络中识别稳定的社区,并帮助解决“解决方案的退化”问题,产生强大的结果。
与分裂图相关的一类随机矩阵中的谱间隙的涌现
原文标题: Emergence of a spectral gap in a class of random matrices associated with split graphs
地址: http://arxiv.org/abs/1712.02429
作者: Kevin E. Bassler, R.K.P. Zia
摘要: 在模拟极端内向和外向人口(XIE)的动态网络中显示出有趣的行为,我们考虑了随机分裂图邻接矩阵集合的谱特性。我们发现,一般而言,在-1和0之间的一个包含单个特征值的主体谱中出现缺口。通过数值分析推导出散体分布的解析表达式。我们还研究了它们与手征集合的关系,这些手征集合与二部图相关。
识别地理标记Twitter消息中的数据噪声,用户偏差和系统错误
原文标题: Identifying Data Noises, User Biases, and System Errors in Geo-tagged Twitter Messages (Tweets)
地址: http://arxiv.org/abs/1712.02433
作者: Ming-Hsiang Tsou, Hao Zhang, Chin-Te Jung
摘要: 许多社交媒体研究人员和数据科学家收集地理标记的推文来进行空间分析或识别针对特定主题或事件的过滤消息的时空模式。本文提供了一个系统的视图来说明来自Twitter Streaming API的地理标记推文的特征(数据噪声,用户偏见和系统错误)。首先,我们发现一小部分(1%)活跃的Twitter用户可以创建大部分(16%)的地理标签推文。其次,在圣地亚哥的Twitter Streaming API边界框之外,还有相当数量(57.3%)的地理标签推文。第三,我们可以通过检查“源”元数据字段来检测垃圾邮件,僵尸程序,电子人脉鸣叫(数据噪声)。在我们的案例研究中,地理标签推文中的部分数据噪音是显著的(加利福尼亚州圣地亚哥29.42%,俄亥俄州哥伦布53.47%)。最后,大多数地理标签推文不是由Android或iPhone设备中的通用Twitter应用创建的,而是由其他平台(例如Instagram和Foursquare)创建的。我们建议采用多步骤的程序,为使用地理标记的推文的未来研究项目消除这些噪音。
线性和非线性市场相关性:表征金融危机和投资组合优化
原文标题: Linear and nonlinear market correlations: characterizing financial crises and portfolio optimization
地址: http://arxiv.org/abs/1712.02661
作者: Alexander Haluszczynski, Ingo Laut, Heike Modest, Christoph Räth
摘要: 美国标准普尔500指数股票在1985年至2015年的日常收益的Pearson相关性和互信息复杂网络已经构建,以调查股票的相互依赖性和性质。我们表明,这两个网络检测质量差异,尤其是在(近期)动荡的市场时期,因此表明在不断变化的经济环境中,不同公司股票之间的巨大波动。衡量非线性相关性的强度是使用替代数据推导出来的,并在金融市场危机期间引发有趣的观察。与危机期间依赖关系主要降低为线性相关的预期相反,我们表明(至少在2008年危机中)非线性效应显著增加。事实证明,在我们以2008年次级抵押贷款危机为例进行论证时,网络中心性概念有可能被用作某种反常市场行为的预警指标。最后,我们应用马克维茨均值方差投资组合优化,并整合非线性依赖的度量来衡量投资风险。与全面投资组合相比,这导致了显著的表现。
欧洲水电和北非太阳能在完全可再生的欧洲电力系统中的相互作用
原文标题: The Interplay of European Hydro Power and North African Solar Power in a Fully Renewable European Power System
地址: http://arxiv.org/abs/1712.02721
作者: Alexander Kies, Bruno Schyska, Lueder von Bremen
摘要: 一个完全可再生的欧洲电力系统带来了各种各样的问题。其中大部分与风能和光伏发电的可再生能源的间歇性有关。平衡欧洲发电量和消耗量的一个可能的解决方案是欧洲水电,其季节性和北非太阳能集中电力及其日常储存特性。在本文中,我们调查了高度可再生的欧洲电力系统中水电和CSP进口的相互作用。我们使用大型天气数据库和历史负载数据来模拟可再生发电,欧洲消费和进口的相互作用。我们介绍和比较不同的水电使用策略,并表明水电和CSP进口必须服务于不同的目的,以最大化整个系统的效益。应该使用CSP进口来弥补每日的赤字,而水力发电可以弥补季节性的不平衡。如果将水电用于“水电优先”战略,只有约四分之一的北非太阳能可以出口到欧洲,而如果采用合作水电战略,这个数字将增加到60%左右。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。