- 幂律序列的记忆界限;
- 通过自动回避随机游走实现高效的模块化优化;
- 具有代数约束的张量聚类给出乳腺癌中可解释的串扰机制组;
- 基于数据的非线性和复杂动力系统识别与预测;
- 图的深度特征学习;
- 学习POI推荐的时空感知;
- 推荐的拓扑面:模型和应用偏差检测;
幂律序列的记忆界限
地址: http://arxiv.org/abs/1506.09096
作者: Fangjian Guo, Dan Yang, Zimo Yang, Zhi-Dan Zhao, Tao Zhou
摘要: 经验发现,复杂系统产生的许多时间序列都遵循不同指数$ \ alpha $的幂律分布。通过从幂律分布中排列独立绘制的样本,我们提出了关于记忆力(1阶自相关)作为$ \ alpha $的函数的非平凡界限,这与平均的$ \ pm 1 $界限为高斯或均匀分布。当$ 1 <\ alpha \ leq 3 $,当$ \ alpha $增长更大时,上限从0增加到+1,而下限保持为0;当$ \ alpha> 3 $时,上限保持+1,而下限下降到0以下。理论界限与数值模拟一致。根据Twitter上的帖子,MovieLens的评分,移动运营商Orange的记录和淘宝的浏览行为,我们发现人类活动产生的经验幂律分布数据遵守这些限制。目前的发现解释了突发时间序列和无标度网络中的一些观察到的约束,并挑战了异构系统中自相关和分类系数等措施的有效性。
通过自动回避随机游走实现高效的模块化优化
地址: http://arxiv.org/abs/1607.08597
作者: Guilherme de Guzzi Bagnato, José Ricardo Furlan Ronqui, Gonzalo Travieso
摘要: 不同种类的随机游走已被证明在复杂网络的结构性质研究中是有用的。其中,自动回避随机游走(SAW)的限制动力学,仅在同一步行中达到未访问的顶点,已成功用于网络探索。因此,SAW是调查网络社区结构的有前途的工具。尽管它的重要性,社区检测仍然是一个开放的问题,由于相关优化问题的计算复杂度高,社区缺乏独特的正式定义。在这项工作中,我们提出了一种基于SAW的模块化优化算法来提取实现高模块化分数的网络的社区分布。我们将SAW与主成分分析结合起来,定义了不相似性度量,并使用了聚集层次聚类。为了评估该算法的性能,我们将其与三种流行的社区检测方法进行比较:Girvan-Newman,Fastgreedy和Walktrap,使用两种类型的合成网络和六个已知的真实世界案例。
具有代数约束的张量聚类给出乳腺癌中可解释的串扰机制组
地址: http://arxiv.org/abs/1612.08116
作者: Anna Seigal, Mariano Beguerisse-Díaz, Birgit Schoeberl, Mario Niepel, Heather A. Harrington
摘要: 我们引入了基于张量的聚类方法从高维,多索引数据集中提取稀疏,低维度结构。具体来说,该框架被设计为能够在存在结构要求的情况下检测数据簇,我们在线性程序中将其编码为代数约束。我们说明了我们的方法,收集了测量基因多样性乳腺癌细胞系对配体阵列的反应的实验。每个实验由细胞系 - 配体组合组成,并且包含两种不同配体剂量水平的早期信号传导激酶MAPK和AKT的时间过程测量。通过施加适当的结构约束和尊重数据的多索引结构,我们的聚类分析可以优化用于生物解释和治疗理解。然后,我们对每个簇进行了MAPK-AKT串扰的机械模型的系统的大规模的探索。这一分析使我们能够量化乳腺癌细胞亚型的异质性,并导致关于细胞系响应配体的机制的假设。我们的聚类方法是一般的,可以针对科学和工业中的各种应用而定制。
基于数据的非线性和复杂动力系统识别与预测
地址: http://arxiv.org/abs/1704.08764
作者: Wenxu Wang, Ying-Cheng Lai, Celso Grebogi
摘要: 从测量数据或时间序列重构非线性和复杂动力系统的问题是许多科学学科,包括物理,生物,计算机和社会科学以及工程和经济学的核心。在本文中,我们回顾了这一前沿和快速发展领域的最新进展,旨在涵盖压缩感知(稀疏信号重建的新型优化范例),噪声诱导动力学映射,扰动,逆向工程,同步等主题,内部组成对齐,全局沉默,Granger因果关系和替代优化算法。通常,这些依赖于来自统计学和非线性物理学的各种概念,例如相变,分岔,稳定性和鲁棒性。这些方法有可能显着提高我们了解从基因监管系统到社会网络到控制这些系统的最终目标的各种复杂动力系统的能力。尽管最近取得进展,但仍然存在许多挑战。因此,本次评论的目的是指出不同背景下出现的具体困难,从而在这个跨学科领域进一步加强努力。
图的深度特征学习
地址: http://arxiv.org/abs/1704.08829
作者: Ryan A. Rossi, Rong Zhou, Nesreen K. Ahmed
摘要: 本文提出了一个称为DeepGL的通用图表示学习框架,用于从大(归因)图学习深层节点和边缘表示。特别地,DeepGL通过导出一组基本特征(例如,图特征)开始,并且自动学习多层次分层图表示,其中每个连续层利用前一层的输出来学习较高阶的特征。与以前的工作相反,DeepGL学习关系函数(每个代表一个特征),这种功能可以泛化跨网络,因此对于基于图的传输学习任务很有用。此外,DeepGL自然地支持归属图,学习可解释的特征,并且是空间有效的(通过学习稀疏特征向量)。此外,DeepGL具有丰富的灵活性,具有许多可互换组件,高效,时间复杂度为$ \ mathcal {O}(| E |)$,并可通过高效的并行实现为大型网络扩展。与最先进的方法相比,DeepGL(1)对于跨网络传输学习任务和归因图表示学习有效,(2)空间有效要求高达6倍的内存,(3)快速上升到运行时性能提升到182倍,(4)在许多学习任务中平均提高了20%以上。
学习POI推荐的时空感知
地址: http://arxiv.org/abs/1704.08853
作者: Bei Liu, Tieyun Qian, Bing Liu, Liang Hong, Zhenni You, Yuxiang Li
摘要: 基于位置的社交网络的广泛传播带来了大量的用户登录数据,这有助于兴趣点(POI)的建议。分布式表示的最新进展揭示了学习低维密集向量以减轻数据稀疏问题。目前对POI建议表征学习的研究将用户和POI都嵌入到共同的潜在空间中,并且基于用户和POI之间的距离/相似度来推断用户的偏好。这种方法不符合用户和POI的语义,因为它们本质上是不同的对象。在本文中,我们提出了一种新颖的时空感知(STA)表示,其将空间和时间信息建模为\ emph {连接用户和POI的关系}。我们的模型概括了知识图嵌入的最新进展。基本思想是嵌入$ <$ time,位置$> $ pair对应于从用户嵌入到POI的转换。由于POI嵌入应该靠近用户嵌入加关系向量,所以可以通过选择与所翻译的POI类似的top- \ emph {k} POI来进行推荐,这些POI都是相同类型的对象。我们对两个实际数据集进行广泛的实验。结果表明,我们的STA模型在高推荐精度,数据稀疏性的鲁棒性和处理冷启动问题的有效性方面实现了最先进的性能。
推荐的拓扑面:模型和应用偏差检测
地址: http://arxiv.org/abs/1704.08991
作者: Erwan Le Merrer, Gilles Trédan
摘要: 推荐在电子商务和娱乐业中扮演着重要的角色。我们建议以图的形式,逐一考虑用户的建议。我们给这个表示的模型。由于对算法透明度越来越感兴趣,因此,我们提出了这些图表的第一个应用程序,即服务提供商引入的推荐偏差的潜在检测。该应用程序依赖于给定用户对提取图的拓扑的分析;我们提出一个关于推荐项目的拓扑接近度的推荐一致性的概念(在最接近k个邻居的项目的度量下,提醒了Watts&Stroggatz的“小世界”模式)。我们终于在一个模型和Youtube爬网上说明了这种方法,针对“推荐给你”的链接(即有偏见或不是由YouTube)的预测。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客网络科学研究速递 进行同步更新,并提供RSS订阅。