- 个体特征预测的因果特征选择;
- 利用三元关系进行假新闻检测;
- 任意复杂网络流行病传播概率动态的最优控制;
- 控制信息融合与风险规避CVaR社会传感器;
- 基于模型的非参数加权网络聚类;
- 随机图对连通性的容错性:对数平均度的相变;
- 记忆诱导的网络自我维持活动机制;
- 现代科学跨学科的优势;
- 具有随机切换能力的种群的生态演化动力学;
- 运输网络的弹性和效率;
- 多视图深度学习预测Twitter用户的位置;
个体特征预测的因果特征选择
原文标题: Causal Feature Selection for Individual Characteristics Prediction
地址: http://arxiv.org/abs/1712.07708
作者: Tao Ding, Cheng Zhang, Maarten Bos
摘要: 人们可以通过他们的人口信息和人格特征来表征。准确地表征人员可以帮助预测他们的偏好,并帮助推荐和广告。越来越多的研究从行为数据中推断出人们的特征。但是,背景因素会使行为数据嘈杂,使得这些数据难以用于预测分析。在本文中,我们将演示如何在特征选择上应用因果识别,以及如何根据这些特征选择特征来预测个体特征。我们利用来自大型主题公园的游客选择数据,结合个性测量来调查游客特征与游客在公园内的选择之间的因果关系。我们证明了基于个体特征的监督预测任务中的因果识别的特征选择的益处。基于我们的评估,我们用基于因果标识选择的特征进行训练的模型优于现有的方法。
利用三元关系进行假新闻检测
原文标题: Exploiting Tri-Relationship for Fake News Detection
地址: http://arxiv.org/abs/1712.07709
作者: Kai Shu, Suhang Wang, Huan Liu
摘要: 新闻消费的社交媒体正在流行起来。社交媒体的低成本,易访问和快速的信息传播,为人们及时寻找新闻带来了好处。但是,这也造成了虚假新闻的广泛传播,即故意捏造的低质量新闻。这个假消息对个人消费者,新闻生态系统甚至社会信任都带来了一些负面影响。以前的假冒新闻检测方法主要集中在新闻内容进行欺骗分类或索赔事实核查。最近的社会和心理学研究表明利用社交媒体数据的潜在重要性:1)确认偏见效应揭示了消费者更喜欢相信确认他们现有立场的信息; 2)回声室效应表明,人们往往追随志趣相投的用户,并在社交媒体上形成隔离的社区。尽管用户在社交媒体上的社交互动为更好的检测假新闻提供了丰富的辅助信息,但是现有的利用社交媒体的工作却相当有限。在本文中,我们同时探讨了发布者偏好,新闻态度和相关用户参与的相关性,并提出了一个三关系假新闻检测框架(TriFN)。我们还提供了两个全面的现实世界的假新闻数据集,以方便假新闻研究。对这些数据集的实验证明了所提出方法的有效性。
任意复杂网络流行病传播概率动态的最优控制
原文标题: Optimal control of a probabilistic dynamic for epidemic spreading in arbitrary complex networks
地址: http://arxiv.org/abs/1712.07713
作者: Fabrizio Angaroni
摘要: 本文提出了离散时间概率动态模拟基于离散时间马尔可夫链过程的基于接触的流行病传播,特别是关注易感染性传染病去除(SIR)模型,这个模型的相图将是呈现。然后,本报告通过Pontryagin的最大原则,提出了代表最优控制策略的一组方程组,在两种不同的情况下,一种接种策略和一种联合接种 - 住院策略,并显示一个数值模拟,扫描程序,这些方程。
控制信息融合与风险规避CVaR社会传感器
原文标题: Controlled Information Fusion with Risk-Averse CVaR Social Sensors
地址: http://arxiv.org/abs/1712.07773
作者: Sujay Bhatt, Vikram Krishnamurthy
摘要: 考虑由风险规避社会传感器和控制器组成的多智能体网络,联合寻求估计未知的自然状态,给出噪声测量。社会传感器网络执行贝叶斯社会学习 - 每个传感器使用以前的社交传感器揭示的信息以及使用贝叶斯规则进行的私人估价 - 将当地的成本函数进行优化。控制器通过歧视性定价(控制输入)按顺序修改传感器的成本函数,以实现长期的全球目标。我们将控制器所面临的随机控制问题作为部分观察马尔可夫决策过程(POMDP),并根据风险价值风险(CVaR)成本中的风险规避因子推导出最优控制策略的结构结果传感器的功能。我们表明,当传感器是风险厌恶时的最优价格序列是超级鞅;即随着时间的推移平均下降。
基于模型的非参数加权网络聚类
原文标题: Model-Based Clustering of Nonparametric Weighted Networks
地址: http://arxiv.org/abs/1712.07800
作者: Amal Agarwal, Lingzhou Xue
摘要: 水污染是全球性的重大环境问题,对公众健康和生物多样性构成极大的环境风险。这项工作的动机是通过增加河网中的硫酸盐浓度来评估煤炭开采潜在的环境威胁,这不属于任何简单的参数分布。然而,现有的网络模型主要集中在具有已知参数权重分布的二元或离散网络和加权网络。我们提出了一种基于指数族随机图模型和局部似然估计的原理非参数加权网络模型,并研究了其基于模型的聚类,并应用于大型水污染网络分析。我们不需要网络权重的任何参数分布假设。所提出的方法极大地扩展了统计网络模型的方法和适用性。此外,它可以扩展到大型环境研究和地球科学研究中的大型复杂网络。我们提出的方法的力量在仿真研究中被证明。
随机图对连通性的容错性:对数平均度的相变
原文标题: Fault Tolerance of Random Graphs with respect to Connectivity: Phase Transition in Logarithmic Average Degree
地址: http://arxiv.org/abs/1712.07807
作者: Satoshi Takabe, Takafumi Nakano, Tadashi Wadayama
摘要: 研究了连通度无界度随机图的容错性。这与具有不可靠中继节点的无线传感器网络的可靠性有关。该模型评估在随机节点移除之后图断开的网络击穿概率。为了建立模型的平均场近似,提出了有限系统的腔体法。然后进行渐近分析。结果,前者使我们能够获得任意数量的节点和任意度分布的近似公式。另外,后者显示相变发生在具有对数平均度的随机图上。这些由数值模拟支持的结果与数学结果一致,表明对无界但不密集的随机图的平均场近似的成功预测。
记忆诱导的网络自我维持活动机制
原文标题: Memory-induced mechanism for self-sustaining activity in networks
地址: http://arxiv.org/abs/1712.07844
作者: A. E. Allahverdyan, G. Ver Steeg, A. Galstyan
摘要: 我们研究了一个由众所周知的神经元动力学模型启发的网络活动维持机制。我们的主要焦点是自我维持的集体活动模式的出现,在这种模式下,没有一个单独的节点能够保持活跃,但是最初提供的活动是在相互作用的集体中持续的。与由网络中存在的(长)循环引起的自维持活动的现有模型相反,这里我们关注类似树的结构,并检查由节点的时间记忆引起的激活机制。这种方法是由社交媒体中的应用程序驱动的,在这些应用程序中,网络循环很长或很少。我们的结果表明,在弱行为噪声下,节点强健地分裂成几个簇,每个簇内节点的部分同步。我们还研究了允许节点改变连接强度的模型的随机加权版本(这可以模拟注意再分配),并且表明它有助于自我维持的活动。
现代科学跨学科的优势
原文标题: The advantages of interdisciplinarity in modern science
地址: http://arxiv.org/abs/1712.07910
作者: Moreno Bonaventura, Vito Latora, Vincenzo Nicosia, Pietro Panzarasa
摘要: 随着大规模研究复杂性的日益增加,需要不同领域专家的共同努力,跨学科研究的优势和成本在当前科学生产的争论中处于中心地位。在这里,我们对现代科学专业和跨学科研究者的科学成就进行了比较评估。借鉴科学生产综合数据集,我们提出了跨学科的双管齐下的方法。对于每个科学家,我们区分源自随着时间积累的知识的背景跨学科性和由于暴露于合作者的知识而产生的社会跨学科性。我们发现,虽然放弃专业化倾向于适度的背景跨学科性能会使性能下降,但跨学科的科学家在所有的职业阶段都要胜过专业化的科学家。而且,成功的科学家倾向于加强合作者的异质性,并将他们网络的多样性与其背景的多样性相匹配。合作通过促进知识传播,获取和创造来维持表现。成功的科学家倾向于吸收更多的合作者的知识,而且速度更快,而不是成功的。合作还为成功的科学家提供了交流思想和协同创造新知识的机会。这些成果可以激励科学家塑造成功的职业,研究机构制定有效的招聘政策,并资助机构颁发增强影响力的赠款。
具有随机切换能力的种群的生态演化动力学
原文标题: Eco-Evolutionary Dynamics of a Population with Randomly Switching Carrying Capacity
地址: http://arxiv.org/abs/1712.07939
作者: Karl Wienand, Erwin Frey, Mauro Mobilia
摘要: 环境变化对人口的生态演化动态有很大的影响,即影响人口规模和组成的变化。在这里,我们研究了一个有限的,波动大小的混合种群,其增长受随机交换承载能力的限制。这模拟了资源丰富和稀缺状态之间的环境波动。人口由两种菌株组成,一种比另一种稍快,在两种情况下竞争:一种是竞争只是资源,另一种是慢(“合作”)菌株产生公共利益。我们调查人口和环境(外部)噪声如何影响人口的生态演化动力学。通过分析和计算手段,研究人口规模与其组成之间的相关关系,探讨在波动环境下公益性生产“生态演化博弈”中出现的合作困境。我们决定在哪些条件下最好合作并生产公共物品;合作是有益的,但是非生产性的压力,当公共产品生产是不利于合作者。通过将线性噪声近似推广到不同大小的种群,我们还分析了人口和环境噪声对大小分布的耦合效应。
运输网络的弹性和效率
原文标题: Resilience and efficiency in transportation networks
地址: http://arxiv.org/abs/1712.08072
作者: Alexander A. Ganin, Maksim Kitsak, Dayton Marchese, Jeffrey M. Keisler, Thomas Seager, Igor Linkov
摘要: 城市交通系统容易受到拥堵,事故,天气,特殊事件和其他昂贵的延误。虽然典型的政策回应优先考虑在正常情况下减少延误以提高城市道路系统的效率,但对提高抗灾能力(定义为系统从额外干扰中恢复)的投资的分析支持仍然不足。在这项工作中,我们通过将交叉点映射到路口与交叉点之间的节点和路段来将铺砌的道路表示为交通网络。我们为美国人口普查局定义的40个城市地区建立了道路网络。我们开发和校准了一个模型来评估使用链路负载的交通延误。负荷可被视为基于交通的中心度量,估计使用相应路段的个体的数量。效率被估计为每个高峰期汽车通勤者的平均年度延误,模拟结果与观测数据接近,但纽约市明显例外。恢复能力估计是由于道路干扰造成的效率变化,在不同的城市之间发现有所不同,随着道路联系的随机丢失5%,从洛杉矶的9.5%到旧金山的56.0%不等,延误时间有所增加。结果表明,许多在正常情况下运行效率低下的城市道路系统仍然具有抗灾能力,而一些效率更高的城市更为脆弱。这意味着在道路项目选择中应明确考虑韧性,而不仅仅是效率,并证明与灾难和其他干扰有关的投资机会。
多视图深度学习预测Twitter用户的位置
原文标题: Multiview Deep Learning for Predicting Twitter Users' Location
地址: http://arxiv.org/abs/1712.08091
作者: Tien Huu Do, Duc Minh Nguyen, Evaggelia Tsiligianni, Bruno Cornelis, Nikos Deligiannis
摘要: 预测用户在像Twitter这样的大型社会网络上的位置的问题已经从诸如社交动荡检测和在线营销等实际应用中出现。 Twitter用户地理位置是一个巨大的文献,是一个困难和积极的研究课题。大多数提出的方法遵循基于内容的或基于网络的方法。前者利用用户生成的内容,而后者利用Twitter用户之间的连接或交互。在本文中,我们介绍一种结合两种方法的优点的新方法。具体而言,我们提出了一个多入口神经网络架构称为MENET利用深度学习和多视图学习的进步。 MENET的普遍性使得能够整合多个数据表示。在Twitter用户地理定位的背景下,我们通过文本,网络和元数据特征来实现MENET。考虑到Twitter用户在相关地理区域内的自然分布,我们将地球表面细分为多尺度单元格,并用单元格的标签对MENET进行训练。我们表明,我们的方法在三个基准数据集上的表现优于现有技术。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。