- 多层网络数据的潜空间模型;
- 文本分类的隐私保护图卷积网络;
- 关联度的二星模型的解析解;
- 带抹消的随机游走:在社交和信息网络上多样化个性化建议;
- 冯·诺伊曼图熵与结构信息之间的相似性:解释,计算和应用;
- 减少COVID-19负担的最佳疫苗接种和治疗策略;
- 在存在调整成本的情况下加快Covid-19疫苗生产的激励措施;
- R包生态系统的实证分析;
- 通过针对拓扑的社交距离来转移流行的临界点;
- 社会网络分析:从图论到Python应用;
- 主单形神经网络用于轨迹预测;
多层网络数据的潜空间模型
原文标题: A Latent Space Model for Multilayer Network Data
地址: http://arxiv.org/abs/2102.09560
作者: Juan Sosa, Brenda Betancourt
摘要: 在这项工作中,我们提出了一种贝叶斯统计模型,以同时表征在一组共同的参与者上定义的两个或多个社会网络。该模型的关键特征是分层的先验分布,它使我们能够共同表示整个系统,从而实现了依赖网络和独立网络之间的折衷。除其他事项外,这样的规范可以轻松地使我们在低维欧几里得空间中可视化多层网络数据,生成反映参与者之间的共识亲和力的加权网络,建立网络之间相关性的度量,评估主体形成的认知判断。参与者之间的关系,并在不同的社交场合执行聚类任务。考虑到不同类型的参与者,规模和关系,我们使用几个实际数据集说明了我们模型的功能。
文本分类的隐私保护图卷积网络
原文标题: Privacy-Preserving Graph Convolutional Networks for Text Classification
地址: http://arxiv.org/abs/2102.09604
作者: Timour Igamberdiev, Ivan Habernal
摘要: 图卷积网络(GCN)是一种强大的体系结构,用于表示学习和对自然以图式出现的文档(例如引文或社会网络)进行预测。包含敏感个人信息的数据(例如以人的个人资料或人际关系为边的文档)容易受到GCN的隐私泄露,因为对手可能会泄露受过训练的模型的原始输入。尽管差异隐私(DP)提供了一个有充分依据的隐私保护框架,但是GCN由于其培训内容而在理论和实践上都面临挑战。我们通过针对GCN调整基于差异私立梯度的培训来应对这些挑战。我们在以两种语言编写的五个NLP数据集的实验设置中,研究了各种隐私预算,数据集大小和两个优化器的影响。我们表明,在某些模型选择下,保留隐私的GCN最多可实现其90%的非私有变体,同时正式保证了强有力的隐私措施。
关联度的二星模型的解析解
原文标题: Analytic solution of the two-star model with correlated degrees
地址: http://arxiv.org/abs/2102.09629
作者: Maíra Bolfe, Fernando L. Metz, Edgar Guzmán-González, Isaac Pérez Castillo
摘要: 指数随机图对于模拟现实世界复杂网络的结构很重要。在这里,我们解决了在稀疏状态下具有度-度相关性的两星级模型。该模型限制了相邻节点(最近的邻居)的度数与两星端点(最近的邻居)的度数之间的平均相关性。我们精确计算了网络的自由能,并表明该模型经历了从一阶跃迁到凝聚态的过程。对于下一个最近邻之间的非负度相关,浓缩相内部的度分布在最大度数处具有单个峰,而对于下一个最近邻之间的负度相关,浓缩相以双峰度分布为特征。我们计算度分类,并显示它们是模型参数的非单调函数,在一阶过渡处具有不连续行为。一阶临界线终止于二阶临界点,可以精确确定其在相图中的位置。我们的结果可以帮助开发具有相关度的复杂网络的更详细模型。
带抹消的随机游走:在社交和信息网络上多样化个性化建议
原文标题: Random Walks with Erasure: Diversifying Personalized Recommendations on Social and Information Networks
地址: http://arxiv.org/abs/2102.09635
作者: Bibek Paudel, Abraham Bernstein
摘要: 大多数现有的个性化系统会推广与用户先前选择匹配的项目或在相似用户中流行的项目。这导致建议与用户已经接触过的建议高度相似,从而将建议隔离在熟悉但隔离的信息孤岛内。在这种情况下,我们开发了一种新颖的推荐框架,其目标是使用对用户项目图的修改后的随机游动探索来改善信息多样性。我们关注政治内容推荐的问题,同时解决适用于其他社交和信息网络中的个性化任务的一般问题。为了在社会网络上推荐政治内容,我们首先提出一种新模型来估计用户和他们共享的内容的意识形态立场,从而能够高精度地恢复思想立场。基于这些估计的位置,我们使用新的基于随机游走的推荐算法来生成多样化的个性化推荐。通过对Twitter讨论的大型数据集进行实验评估,我们表明基于 emph 带有擦除的随机游走的方法能够产生意识形态上更多样化的建议。我们的方法不依赖于有关用户或内容生产者偏见的标签的可用性。通过对来自其他社交和信息网络的开放基准数据集的实验,我们还证明了我们的方法在推荐各种长尾物品时的有效性。
冯·诺伊曼图熵与结构信息之间的相似性:解释,计算和应用
原文标题: On the Similarity between von Neumann Graph Entropy and Structural Information: Interpretation, Computation, and Applications
地址: http://arxiv.org/abs/2102.09766
作者: Xuecheng Liu, Luoyi Fu, Xinbing Wang, Chenghu Zhou
摘要: 冯·诺依曼图熵是基于拉普拉斯谱的图复杂度的量度。最近,它在网络数据驱动的各种学习任务中发现了应用。然而,这是计算上的要求,并且难以使用简单的结构模式来解释。由于拉普拉斯谱与度数序列之间的密切关系,我们推测结构信息(定义为归一化度数序列的Shannon熵)可能是可扩展且可解释的冯·诺依曼图熵的良好近似。因此,在这项工作中,我们研究了结构信息和被称为 em熵间隙的von Neumann图熵之间的差异。基于对度序列由拉普拉斯谱进行了谱化的认识,我们首次证明了在任何无向非加权图中的熵差在 0 和 log_2 e 之间。因此,我们证明结构信息是冯·诺伊曼图熵的良好近似,可以同时实现可证明的准确性,可伸缩性和可解释性。这种近似进一步应用于与熵有关的两个任务:网络设计和图相似性度量,其中提出了新颖的图相似性度量和快速算法。我们在各种比例和类型的图上的实验结果表明,非常小的熵差距很容易应用于各种图和加权图。作为冯·诺依曼图熵的近似值,结构信息是主要方法中唯一同时实现高效和高精度的信息。它比SLaQ至少快两个数量级,并且具有可比的精度。我们基于结构信息的方法在两个与熵有关的任务中也表现出卓越的性能。
减少COVID-19负担的最佳疫苗接种和治疗策略
原文标题: Optimal Vaccination and Treatment Strategies in Reduction of COVID-19 Burden
地址: http://arxiv.org/abs/2102.09802
作者: Bishal Chhetri, D.k.k. Vamsi, S Balasubramanian, Carani B Sanjeevi
摘要: 在这项研究中,我们建立了一个数学模型,结合了特定年龄的COVID-19传播动力学,以评估疫苗接种和治疗策略在减少COVID-19负担量中的作用。最初,我们建立模型解的正性和有界性,并计算基本繁殖数。然后,我们以疫苗接种和治疗作为控制变量来制定最优控制问题。针对与疫苗接种成本相关的体重常数的不同值和不同的传播水平,分析了最佳的疫苗接种和治疗策略。从这些结果中发现,联合策略(接种和治疗)在最小化感染和疾病引起的死亡率方面效果最好。为了最大程度地减少COVID-19感染和COVID-19诱发的死亡,已观察到最佳控制策略应优先于40岁以上的人群。对于轻度流行病( R_0 in(0,2)),个体策略和联合策略之间没有太大差异。对于 R_0(R_0 in(2,10))较高的值,发现组合策略在最大程度降低总体感染方面是最好的。还分析了改变疫苗效力的感染曲线,发现更高的疫苗效力导致更少的感染数和COVID诱导的死亡。
在存在调整成本的情况下加快Covid-19疫苗生产的激励措施
原文标题: Incentives for accelerating the production of Covid-19 vaccines in the presence of adjustment costs
地址: http://arxiv.org/abs/2102.09807
作者: Claudius Gros, Daniel Gros
摘要: 随着大流行的继续,延误疫苗供应的代价很高。但是,在存在调整成本的情况下,企业有动力逐步提高产能。现有合同仅指定了在一定时期内要供应的固定数量,因此没有提供动力来加速产能的增长。高价不会改变这一点。最优合同将规定随着时间的推移价格降低的时间表,可以复制社会最优价格。
R包生态系统的实证分析
原文标题: An Empirical Analysis of the R Package Ecosystem
地址: http://arxiv.org/abs/2102.09904
作者: Ethan Bommarito, Michael J Bommarito II
摘要: 在这项研究中,我们提供了R包生态系统的全面,纵向的经验总结,不仅包括CRAN,还包括Bioconductor和GitHub。在过去的20年中,我们分析了25,000多个软件包,150,000个发行版和1,500万个文件,提供了跨软件包,发行版,作者,许可证和其他重要元数据的通用指标的全面计数和趋势。我们发现,在所有指标下,生态系统的历史增长都是强劲的,主动软件包的复合年增长率为29%,新版本的复合年增长率为28%,主动维护者的复合年增长率为26%。与许多类似的社会系统一样,我们发现了一些高度偏斜的分布,这些分布具有实际意义,包括每个软件包的发行版,每个作者或维护者的软件包和发行版,软件包和维护者的依存度以及每个软件包的大小。释放。例如,排名前五的软件包几乎占所有软件包的25%,而排名前十的维护者支持的软件包占一半以上。我们还强调了生态系统的动态性质,记录了R的增长过程中的急剧加速和明显减速。从许可的角度来看,我们发现相当多的软件包是在copyleft许可下分发的,或者完全省略了许可信息。本文中的数据,方法和计算为有关R和CRAN的公共讨论和行业决策提供了依据,为将来更广泛地研究R软件生态系统和“数据科学”奠定了基础。
通过针对拓扑的社交距离来转移流行的临界点
原文标题: Moving the epidemic tipping point through topologically targeted social distancing
地址: http://arxiv.org/abs/2102.09997
作者: Sara Ansari, Mehrnaz Anvari, Oskar Pfeffer, Nora Molkenthin, Frank Hellmann, Jobst Heitzig, Juergen Kurths
摘要: 社会系统的流行阈值是感染率和恢复率之比,在该比率之上,传播于其中的疾病成为流行病。在没有药物干预措施(即疫苗)的情况下,控制特定疾病的唯一方法是通过非药物干预措施(如社会疏远)将这一阈值移至与该疾病相对应的流行阈值之上,从而使该系统从流行病转变为传染病。非流行制度。将疾病建模为在社交图谱上的传播过程,可以通过删除某些图谱链接来建模社交距离。推测结果图的邻接矩阵的最大特征值对应于系统流行阈值。在这里,我们使用马尔可夫链蒙特卡罗(MCMC)方法来研究那些在减少邻接矩阵的最大特征值方面表现出色的链接删除。 MCMC方法从相对规范网络集合中生成具有定义的期望值 lambda_ max 的样本。我们称此为“控制良好的网络集成”(WCNE),并将其结构与具有相同链路密度的随机精简网络进行比较。我们观察到WCNE中的网络在度分布上趋于更均一,并利用这种见解来定义两种即席移除策略,这也大大降低了最大特征值。有针对性地删除80%的链接可能与随机删除90%的链接一样有效,从而使个人拥有两倍的联系人。
社会网络分析:从图论到Python应用
原文标题: Social Network Analysis: From Graph Theory to Applications with Python
地址: http://arxiv.org/abs/2102.10014
作者: Dmitri Goldenberg
摘要: 社会网络分析是通过使用网络和图论来调查社会结构的过程。它结合了用于分析社会网络结构的各种技术以及旨在解释在这些结构中观察到的潜在动态和模式的理论。它是一个固有的跨学科领域,最初起源于社会心理学,统计学和图论领域。本讲座将涵盖社会网络分析理论,并简要介绍图论和信息传播。然后,我们将使用NetworkX深入研究Python代码,以更好地理解网络组件,随后通过从真实的熊猫和文本数据集中构造和隐含社会网络。最后,我们将讨论实际用例的代码示例,例如使用matplotlib进行可视化,社会中心分析以及信息传播的影响最大化。
主单形神经网络用于轨迹预测
原文标题: Principled Simplicial Neural Networks for Trajectory Prediction
地址: http://arxiv.org/abs/2102.10058
作者: Nicholas Glaze, T. Mitchell Roddenberry, Santiago Segarra
摘要: 我们考虑针对单纯复形的数据构建神经网络体系结构。在研究简单复数的链复数上的图时,我们定义了简单神经网络体系结构的三个理想属性:即置换等方差,方向等方差和简单知觉。前两个属性分别说明了以下事实:单纯形复数中的节点索引和单纯形方向是任意的。最后一个属性编码了一个理想的特征,即神经网络的输出取决于整个简单复数而不是其维数的子集。基于这些特性,我们提出了一个简单的卷积体系结构,其根植于代数拓扑的工具中,用于轨迹预测问题,并表明当使用奇数,非线性激活函数时,它遵循所有这三个属性。然后,我们证明了该体系结构在合成和实际数据集上外推轨迹时的有效性,并特别强调了对看不见的轨迹的通用性方面的收益。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。