数据派THU

2022图机器学习必读的11大研究趋势和方向: 微分方程/子图表示/图谱理论/非对称/动态性/鲁棒性/通用性/强化学习/图量子等...

来源：智源社区
本文约6900字，建议阅读10+分钟
本文为你总结了图机器学习过去一年中的研究亮点，并对该方向在 2022 年的发展趋势进行了展望。

[ 导读 ]几何机器学习和基于图的机器学习是当前最热门的研究课题之一。在过去的一年中，该领域的研究发展迅猛。在本文中，几何深度学习先驱 Michael Bronstein 和 Petar Veličković 合作，采访了多位杰出的领域专家，总结了该领域过去一年中的研究亮点，并对该方向在 2022 年的发展趋势进行了展望。

作者：Michael Bronstein

牛津大学DeepMind人工智能教授、Twitter图机器学习负责人

编译：熊宇轩

一、要点概述

几何在机器学习中变得越来越重要。微分几何和同源场为机器学习研究引入了新的思想，包括利用了对称性和类似于图中的曲率的新等变图神经网络（GNN）架构，以及在深度学习模型中理解和利用不确定性。
消息传递仍然是 GNN 的主导范式。在 2020 年，研究社区意识到了消息传递 GNN 的不足之处，并寻求这种范式之外的更具表现力的架构。2021 年，很明显，消息传递仍然占据主导地位，因为有的研究工作表明，将 GNN 应用于子图可以获得更好的表达能力。
微分方程催生了新的 GNN 架构。NeuralODE 的趋势扩展到了图机器学习领域。一些工作说明了如何将 GNN 模型形式化定义为连续微分方程的离散形式。在短期内，这些工作将催生新的可以规避 GNN 中的常见问题（如过平滑和过压缩）的架构。从长远来看，我们可能会更好地理解 GNN 的工作原理，以及如何使它们更具表现力和可解释性。
信号处理、神经科学和物理学领域的旧思想焕发了新生。许多研究者认为，图信号处理重新点燃了最近对图机器学习的兴趣，并为该领域提供了第一套分析工具（例如，广义傅里叶变换和图卷积）。表征理论等其它经典信号处理和物理学中的基本技术已经在2021年取得了一些重要进展，并仍有很大的潜力。
为复杂系统建模不仅需要图。2021 年的诺贝尔物理学奖授予 Giorgio Parisi，以表彰他对复杂系统的研究。虽然，这样的系统通常可以被基本地抽象为图。但我们有时必须考虑非成对关系和动态行为等更复杂的结构。2021 年的多项工作讨论了动态关系系统，并展示了如何将 GNN 扩展到高阶结构（如传统上在代数拓扑领域处理的细胞和单纯复杂结构）。我们可能会看到机器学习更多地采用该领域的其它思想。
在图机器学习领域中，推理、公理化和泛化的问题仍然是重要的有待解决的问题。在这一年中，我们看到了受算法推理启发的 GNN 架构的持续进步，以及在图结构任务上更鲁棒的与分布外泛化（OOD）相关的工作。如今，我们有了与广义 Bellman-Ford 算法显式一致的知识图谱推理器，以及利用分布偏移的显式因果模型的图分类器。可以说，这些都是未来具有广阔前景的更鲁棒、更通用的 GNN 的发展方向。在2022年，这其中许多的课题可能将取得很大的进展。
图在强化学习中越来越流行，但可能还有很大的探索空间。也许并不令人意外的是，强化学习中存在许多有关图和对称性的问题（通常在强化学习智能体的结构中，或在对环境的表征中）。2021 年，有一些研究方向试图利用这种结构，并取得了不同程度的成功。我们现在对如何在强化学习中利用这些对称性有了更好的理解（包括在多智能体系统中）。然而，将智能体建模为图似乎不需要严格地使用图结构。尽管如此，我们相信，图和几何赋能的强化学习在 2022 年具有广阔的发展前景。
AlphaFold 2 是几何机器学习领域的重要成果，也是结构生物学领域的范式转变。20 世纪 70 年代，诺贝尔化学奖得主 Christian Anfinsen 提出了预测蛋白质三维折叠结构的可能性。这是一项非常困难的计算任务，是结构生物学领域的「圣杯」。2021年，DeepMind 的 AlphaFold 2 打破了该问题之前的纪录，取得了让领域专家们信服的准确率，并得到了广泛的应用。AlphaFold 2 的核心正是一个基于等变注意力机制的几何架构。
GNN 及其与 Transformer 模型的融合助力了药物研发和设计。实际上，GNN 的起源可以追溯到 20 世纪 90 年代的计算化学工作。因此，分子图的分析是最流行的 GNN 应用之一，也就不足为奇了。2021 年，这一领域取得了持续的显著进展，涌现出了数十个新架构和几项超越对比基准的成果。将 Transformer 应用于图数据也取得了巨大的成功，它有望模拟 Transformer 架构在自然语言处理领域成功的关键之处：能够跨任务泛化的大型预训练模型。
人工智能主导的药物发现技术越来越多地使用了几何和图机器学习。AlphaFold 2 和分子图神经网络的成功让人类距离通过人工智能设计新药的梦想更近了一步。Alphabet 的新公司 Isomorphic Labs 标志着工业界「压宝」于这项技术。然而，为了实现这类梦想，对分子间的相互作用建模是必须解决的重要前沿课题。
基于图的方法也助力了量子机器学习。对于机器学习领域的大多数专家来说，量子机器学习仍然是一个神器的小众方向，但随着量子计算硬件的逐渐普及，它很快就成为了现实。Alphabet X 最近的工作显示了图结构归纳偏置在量子机器学习架构中的优势，他们结合了这两个貌似不相关的领域。从长远来看，由于量子物理系统通常拥有丰富而深奥的群对称性，我们可以将这种性质用于量子结构设计，几何可能会扮演更重要的角色。

2021 年，几何和基于图的机器学习方法出现在一系列备受瞩目的应用中

二、几何在机器学习中的重要性与日俱增

如果我们必须选择一个词，它在 2021 年遍布图表示学习的几乎每个领域，毫无疑问，「几何」一词将是首选。

Melanie Weber：

「在过去的一年里，我们看到许多经典的几何思想以新的方式在图机器学习领域中得以应用」——Melanie Weber，牛津大学数学研究所 Hooke 研究员

Melanie 认为：值得注意的例子包括利用对称性更高效地学习模型，最优传输相关概念的应用，或在表示学习中使用微分几何中的曲率概念。

最近，人们对理解关系型数据的几何特性和利用这些信息学习良好的（欧氏或非欧）表征产生了浓厚的兴趣[1]。这催生了许多对特定几何编码的 GNN 架构。值得注意的例子是双曲 GNN 模型[2]，该模型于 2019 年底作为学习层次化数据的高效表征的工具被首次提出。在过去的一年里，出现了大量的新模型和架构，它们能够更高效地学习双曲表征，或者能捕获更复杂的几何特征[3, 4]。此外，还有一类工作利用了等变性和对称性等几何信息[5]。

图注：今年，在图神经网络领域，我们看到了几何技术的激增。例如，等变信息传递在小分子性质预测、蛋白质折叠等生化应用中起到了关键作用。

Melanie 进一步研究了微分几何，指出它在 2022 年存在许多潜在的应用方向：离散微分几何（研究图或单纯复形等离散结构的几何）已被用于分析 GNN。离散曲率概念是表征离散结构局部和整体几何性质的重要工具。Topping 等人在论文「Understanding over-squashing and bottlenecks on graphs via curvature」中提出了曲率在图机器学习中的一种重要应用[6]，在图重连的背景下研究离散 Ricci 曲率，作者提出了一种新的方法来缓解 GNN 中的过压缩效应。未来，离散曲率很可能与图机器学习中的其它结构和拓扑问题联系在一起。

Melanie 希望这些课题将在 2022 年继续影响该领域，被应用于更多的图机器学习任务。这可能会推动计算方面的进步，从而减轻实现非欧算法的计算挑战，传统的针对欧式数据设计的工具很难胜任这些工作。此外，离散曲率等几何工具的计算成本很高，因此很难将它们集成到大规模应用中。计算技术的进步或专用程序库的发展可以使相关从业者更容易使用这些几何思想。

Pim de Haan：

「图神经网络设计者越来越重视图丰富的对称结构。」——Pim de Haan，阿姆斯特丹大学博士生

传统上，GNN 采用具有置换不变性的消息传递方式，后来的工作利用群与表示理论构造节点置换群表示之间的等变映射。最近，类比于流形的局部对称性（称为度规对称性），我们开始研究由同构子图产生的图的局部对称性。我们发现应该用对称理论而不是群分析某些图中的问题，将对称性整合到神经网络架构中可以提高某些图机器学习任务（例如，分子预测）的性能。

图注：图机器学习研究者利用图中丰富的对称结构。

Pim 预测道：在新的一年里，我希望看到范畴论成为一种广泛应用于神经网络的设计语言。这将给我们提供一种形式化的语言来讨论和利用比以前更复杂的对称。特别是，我很高兴看到它被用于处理图的局部和近似对称，结合点云的几何和组合结构，并帮助我们研究因果图的对称性。”

Francesco Di Giovanni：

「尽管图是不可微的，但是许多在流形分析中被成功应用的思想正逐渐出现在 GNN 领域中。」——Francesco Di Giovanni，Twitter 机器学习研究员

Francesco 对偏微分方程方法特别感兴趣，这种方法最初被用于研究曲面，Francesco 等人用它来处理图像。他们探索了「图重连」的思路，「图重连」指的是对底层邻接关系的修改，它属于对几何流方法的拓展。此外，他们还利用基于边的曲率的新概念来研究 GNN 中的过压缩问题，并提出了一种图重连方法。对于保持和破坏对称形式的分子，几何也被认为是将 GNN 应用于分子的关键因素。

Francesco 认为，这个领域的研究刚刚兴起。图重连技术将可能在解决消息传递的一些主要缺陷方面发挥作用，这些缺陷包括在异类数据集上的性能和处理长距离依赖关系。我们希望能很快弥平在图上的卷积和流形上的卷积之间的概念上的较大差异，这可能会导致下一代 GNN 的出现。最后，Francesco 很高兴看到几何变分方法进一步揭示了 GNN 内在的动力学，并希望能够提供更有原则的方法来设计新的 GNN 架构、比较现有的架构。

图注：Ricci 曲率、几何流等微分几何领域的概念被用于图机器学习，改进 GNN 中的信息流。

Aasa Feragen:

「人们希望通过微分几何等数学理论为那些精确的公式中存在非线性几何的问题给出有理有据的解决方案。」——Aasa Feragen，哥本哈根大学助理教授

Aasa 认为，微分几何在理解和利用深度学习模型的不确定性方面发挥着基础性的作用。例如，使用模型不确定性生成数据的几何表示，揭示在标准欧式表征下仍然十分模糊的生物信息。另一个例子是，利用由局部有向数据编码的黎曼几何对结构化的大脑连接的不确定性进行量化。

几何模型通常用于经过深度预处理的数据，揭示其几何结构。数据通常是根据原始数据估计的，而原始数据存在误差和不确定性。Aasa 希望 2022 年有更多工作开始评估原始数据的不确定性对我们直接处理的数据的影响，以及这种不确定性应该如何传播到模型上。Aasa 希望能够将测量误差纳入对非欧数据的分析，努力打破统计和深度学习之间的鸿沟。

三、消息传递仍然是 GNN 的主导范式

Haggai Maron：

「我希望子图 GNN 以及相应的重构猜想这一研究方向在新的一年里成果丰硕。」——Haggai Maron，英伟达研究科学家

由于等价于 Weisfeiler-Lehman 测试，图机器学习领域遭遇到了消息传递范式的根本限制。Michael Brostein 在 2021 年预测道：想要继续发展图机器学习，就需要脱离 2020 年及之前在占据主导地位的消息传递机制。如今，这一预测在一定程度上得以实现。然而，尽管 2021 年已经出现了一些表达能力更强的 GNN 架构，但其中大多数仍然停留在消息传递机制的范围内。

最近，一些研究者使用子图来提高 GNN 的表达能力。Haggai Maron 曾指出：「子图 GNN」底层的想法是将图表示为其子结构的集合，在 Kelly 和 Ulam 在上世纪 60 年代有关图重建猜想的工作就可以发现这一主题。如今，同样的思想被用来构造富有表达能力的 GNN，而 GNN 的相关工作反过来又催生了新的、更精细的重构猜想。

四、微分方程催生了新的 GNN 架构

图注：2021 年，一些研究工作通过离散扩散偏微分方程推导图神经网络。

Pierre Vandergheynst：

「这提出了一种新的观点，让我们可以使用 GNN 为下游机器学习任务提取有意义的信息，并将关注焦点从支撑信息的域转移到使用图作为针对信号的计算的支撑。」——Pierre Vandergheynst，洛桑联邦理工学院

通过用微分方程表示的物理系统动力学重新构建图上的学习，是 2021 年的另一个趋势。正如常微分方程是理解残差神经网络的强大工具一样（「Neural ODEs」被评为 NeurIPS 2019 的最佳论文），偏微分方程可以在图上建立信息传播的模型。我们可以通过迭代的数值计算求解这样的偏微分方程，从而恢复出许多标准的 GNN 架构。此时，我们将图看作对连续对象的离散化表示：

Pierre 认为，在 2022 年，使用图作为针对给定数据集执行局部连贯的计算、交换信息的机制，并且关注数据的整体属性，将成为一种新的趋势。这将在无监督、零样本学习领域激发人们的兴趣。

五、信号处理、神经科学和物理学领域的旧观点焕发新生

许多现代的 GNN 方法都起源于信号处理领域。图信号处理（GSP）之父 Pierre Vandergheynst 从这个角度为图机器学习方法的发展提供了一个有趣的视角：

图信号处理对数字信号处理的扩展体现在两个方面：（1）推广了支撑信息的域。传统的数字信号处理定义在低维欧式空间上，图信号处理将其定义在了复杂得多、但是结构化的对象上。我们可以用图（例如，网络、网格曲面）来表示这些对象。（2）使用图（某种最近邻），从而抛开结构化域，直接处理一些数据集，表示样本之间的相似性。这背后的思想是，标签域继承了一些可以使用图定义并通过适当转换捕获的规律。因此，图可以支撑整个数据集上的局部计算。GNN 中的一些有趣的思路可以追溯到这些早先的动机，2021 年有一些亮点工作延续了这一趋势。

Pierre Vandergheynst：

「经典线性变换（例如，傅里叶变换、小波变换）给出了一个具有某些数学特性（例如，平滑信号具有低频傅里叶系数，分段平滑信号具有稀疏、局部的小波稀疏）的通用潜空间」——Pierre Vandergheynst，洛桑联邦理工学院

过去，研究者们通过构建线性变换来揭示信号的特性。物理学家在设计基于群作用的不同对称的等价变换方面尤为领先。这些群作用包括，仿射群上的小波变换、Weyl-Heisenberg 群的线性时频分析等。关于数学物理中相干态领域的工作提出了一种通用的解决方法：通过使用群表示对函数进行参数化，从而构建某种线性变换。2021 年，一些出色的论文进一步引入了非线性和可学习的参数化函数，赋予了 GNN 对称性，使它们在物理或化学问题中大放异彩：

图注：群表示是一种信号处理和物理学领域的传统工具，使我们可以推导出可以应用于流形的坐标无关的深度学习架构。

Pierre 认为，由于某些应用需求、适应性和可解释性之间权衡（结构化变换域适应性较差但可解释性很强，GNN 可以在二者之间取得很好的平衡），构建结构化潜空间的趋势将会在 2022 年得以延续。

在传统上，神经科学与信号处理密切相关。事实上，我们通过分析大脑传递的电信号来了解动物如何感知其周围的世界。

Kim Stachenfeld：

「我的研究背景是计算神经科学，我首次在研究中用到图是因为我希望表示任何动物如何学习结构。」——Kim Stachenfeld，DeepMind 研究科学家

我们可以通过图这种数学对象来分析任何动物如何表示通过独立的经验片段获取的相关概念，并将其拼接成一个全局连贯的、集成的知识体系。

2021 年，一些研究将神经网络的局部操作和底层或内在的集合表征相结合。例如，一些有关 GNN 中不变性的工作使 GNN 可以利用图结构以外的几何和对称性。此外，使用图拉普拉斯特征向量作为图 Transformer 的位置编码，使 GNN 可以在不受其约束的条件下，利用关于内在、低维几何性质的信息。

Kim 对 GNN 在神经科学和更广阔的领域中的应用感到十分兴奋，尤其是在超大规模真实数据上的应用。例如，使用 GNN 预测交通状况、对复杂物理动力学进行仿真、解决超大规模图上的问题。将 GNN 用于神经数据分析的工作也纷纷涌现。这些问题对现实世界产生影响，它们要求模型能够高效扩展并泛化，同时仍然能够捕获真正的复杂的动力学。GNN 的优化目标是对结构和表达能力的平衡。

六、对复杂系统建模不仅需要图

Tina Eliassi-Rad：

「2021 年诺贝尔物理学奖授予了对复杂系统的研究。从根本上说，复杂系统是由实体及其之间的交互组成的。复杂系统通常被表示为复杂网络，而这为图机器学习提供了动力。」——Tina Eliassi-Rad，东北大学教授

随着图机器学习逐渐成熟，我们需要仔细分析以不同形式体现的系统依赖（例如，子集、时间、空间），通用的数学表征（图、单纯复形、超图），它们的底层假设。没有完美的方法可以表示一个复杂系统，检验来袭一个系统的数据集时所做的建模决策可能并不一定能迁移到另一个系统上，甚至不能迁移到来自同一系统的另一个数据集上。然而，考虑与我们选择的数学表示法相关的系统依赖，为图机器学习指出了新的研究机会。

Pierre Vandergheynst：

图并不能为所有的复杂系统提供适当的模型，我们需要图之外的方式。2021 年，一些优秀的论文提出了通过图的泛化获取的新的结构化信息域。使用单纯复形和代数拓扑的其它思想来构建新的神经网络在理论和实践上对 GNN 进行了提升。这一趋势在 2022 年会延续下去，我们会深入研究通过代数拓扑或微分几何提供的大量结构化数学对象。

图注：将图拓展到胞腔复形或单纯复形，可以传递更复杂的拓扑消息，从而产生超越 WL 测试表达能力的 GNN 架构。

Cristian Bodanr：

「我们很可能会看到采用更奇特的数学对象，这些数学对象迄今为止还鲜为探索。我相信这些拓扑方法降维分析和理解 GNN 提供一套新的数学工具。」——Cristian Bodnar，剑桥大学博士

Cristian Bodnar 热衷于代数研究拓扑和图机器学习之间的联系。在过去的一年中，单纯复形和胞腔复形上的卷积和消息传递模型解决了许多 GNN 的缺陷（例如，检测特定的子结构、捕获长距离和高阶交互、处理高阶特征、跳出 WL 测试的层次）。他们在分子相关的问题、轨迹预测和分类等任务中取得了目前最优的结果。

2022 年，Cristian 预计这些方法将会扩展到令人激动的新应用上，例如：计算代数拓扑、链接预测、计算机图形学，等。

Rose Yu：

「我对图机器学习在学习时空动力学中扮演的角色感到十分兴奋。」——Rose Yu，UCSD 助理教授

时空图是一种重要的复杂网络系统，它的结构会随着时间演变。Rose 认为，COVID-19 预测、交通预测、轨迹建模等应用需要捕获高度结构化的时序数据的复杂动力学。图机器学习有能力捕获时间序列、空间依赖之间的交互，以及动力学中的相关性。

2022 年，我们乐见时间序列和动态系统中的思想与图机器学习融合。希望这些思想将催生新的模型设计、训练算法，帮助我们更好地理解复杂动态系统的内在机制。图神经网络具有置换对称性（不变性或等变性），对称性发现是图表示学习领域中一个被忽视的重要问题。但这种全局对称性可能从根本上被限制，有一些优秀的工作将图神经网络推广到置换之外的对称群和局部对称中。我们希望看到更多关于图神经网络对称性的研究。

原文链接：

https://towardsdatascience.com/predictions-and-hopes-for-geometric-graph-ml-in-2022-aa3b8b79f5cc#0b34

编辑：黄继彦

Java入门笔记（1）王磊鑫 java 笔记开发语言
引言在计算机编程的广袤宇宙中，Java无疑是一颗格外耀眼的恒星。那么，Java究竟是什么呢？Java是美国Sun公司（StanfordUniversityNetwork）在1995年推出的一门计算机高级编程语言。曾经辉煌的Sun公司在2009年被Oracle（甲骨文）公司收购，但Java的影响力并未因此而衰减。普遍认同Java的联合创始人之一詹姆斯·高斯林（JamesGosling）为“Java之
物联网导论复习材料物腐虫生物联网学习
简答题Q1：物联网的概述，特点，模型，应用，重点是应用层，云计算，数据集成。物联网的概述物联网（IoT，InternetofThings）是指通过各种传感器、设备和网络技术，将物理世界中的物体连接到互联网，实现数据的采集、传输、处理和应用的智能化系统。物联网的特点全面感知：通过传感器实时采集数据。可靠传输：通过互联网和无线网络传输数据。智能处理：利用云计算和大数据技术对数据进行分析和处理，实现智能
GitHub 汉化插件安装和配置指南昌耘李Raymond
GitHub汉化插件安装和配置指南github-hans项目地址:https://gitcode.com/gh_mirrors/gi/github-hans1.项目基础介绍和主要的编程语言项目基础介绍GitHub汉化插件（GitHubTranslationToChinese）是由52cik开发的一个开源项目，旨在帮助英文不太熟练的用户更好地使用GitHub。该项目通过将GitHub的界面翻译成中文
基于遗传算法的城市旅行问题（TSP）求解 NovakG_ 深度学习 python 算法深度学习神经网络
1.遗传算法背景介绍遗传算法是一种基于生物进化论中的自然选择和遗传机制的优化算法，模拟了生物进化过程以搜索最优解。通过仿真染色体的交叉、变异等操作，遗传算法将求解过程转换为类似生物进化的迭代运算。该算法在解决复杂的组合优化问题时，通常比常规优化算法更高效，且具有广泛应用，包括组合优化、机器学习、信号处理、自适应控制和人工生命等领域2.遗传算法基本解题思路遗传算法的设计思路主要受到大自然中生物体进化
为AI聊天工具添加一个知识系统之65 详细设计之6 变形机器人及伺服跟随一水鉴天软件智能智能制造人工语言人工智能
本文要点要点三种“数”条件：necessaryconditionX-scale,sufficientconditionY-size,INUSconditionZ-score。带自己的下标。下标值范围：scale(水平)1~5,size（垂直）1~3，score（正交基）1~10。三个轴各自的运动规律（平移，竖划，旋转）给出由图形算法支持的具有伺服跟随能力的变形机器人。利用不同感觉器官发挥不同跟随能
VBA语言的安全开发萧澄华包罗万象 golang 开发语言后端
VBA语言的安全开发在当今信息化迅猛发展的时代，数据安全和信息保护显得尤为重要。VBA（VisualBasicforApplications）作为一种广泛应用于MicrosoftOffice系列软件的编程语言，因其简易性和强大功能，成为了众多企业和个人用户在日常工作中的热门选择。然而，随着VBA应用的普及，安全隐患也逐渐显露，代码的安全漏洞可能导致信息泄露、数据篡改甚至系统攻击。因此，掌握VBA语
GBase 数据库在大数据环境下的应用与优势 big crab 数据库大数据
引言随着大数据技术的发展，传统数据库面临着越来越多的挑战。尤其是在处理海量数据时，如何在保证高性能的同时，确保系统的可扩展性、容错性和高可用性，成为许多企业关心的问题。GBase数据库系列，特别是GBase8a、GBase8s和GBase8c，提供了一种新型的解决方案，它们能够在大数据环境下提供卓越的性能和可靠性。本文将深入探讨GBase数据库在大数据环境中的应用及其优势。一、GBase数据库系列
GBase 数据库的性能调优与故障排查 big crab 数据库
一、引言在现代企业的数据驱动运营中，数据库的性能是核心问题之一。GBase数据库作为高性能、高可用的数据库解决方案，被广泛应用于大数据、高并发的场景中。为了最大化GBase数据库的性能，了解如何调优数据库的配置、查询执行计划和硬件资源使用至关重要。本文将深入探讨GBase数据库的性能调优策略、常见故障排查方法，并结合SQL示例和调优技巧，帮助开发者和数据库管理员提升GBase数据库的整体效率。二、
GBase数据库在大数据环境下的存储和查询优化策略 big crab 数据库大数据
一、引言随着大数据时代的到来，数据量的激增给数据库管理和查询性能带来了巨大的挑战。尤其是对于关系型数据库，如何在海量数据的存储和查询中保持高效的性能，已经成为企业IT架构设计中的关键问题。GBase数据库，作为一款高性能的关系型数据库，凭借其强大的数据处理能力和高可用性，在大数据领域得到了广泛应用。本文将深入探讨GBase数据库在大数据环境下的存储与查询优化策略，结合GBase8a、GBase8s
AI时代，需要怎样的架构师？腾讯云架构师峰会来了！架构
引言架构设计对应用有关键性的影响，不仅决定应用的整体品质，还直接影响开发、维护和扩展的难易度。卓越的架构设计不仅能够确保系统的稳定性、高效性和可扩展性，还能大幅提升研发效能，同时显著降低维护成本。在快速变化的技术环境中，架构师们面临业务需求快速迭代、数据量急剧膨胀以及系统复杂性不断提升等挑战。随着云计算、大数据、人工智能等前沿技术的蓬勃发展，一系列创新解决方案如微服务架构、AI大模型、自动化运维工
基于Hough变换与分数阶变分PDE的图像去雨算法实现（附带Matlab源码）心之飞翼算法 matlab 计算机视觉 Matlab
基于Hough变换与分数阶变分PDE的图像去雨算法实现（附带Matlab源码）图像去雨是计算机视觉领域的一个重要问题，它的目标是从雨滴造成的图像中恢复出原始的清晰图像。本文将介绍一种基于Hough变换和分数阶变分PDE（PartialDifferentialEquation）的图像去雨算法，并提供相应的Matlab源代码。算法步骤如下：导入图像首先，我们需要导入包含雨滴的图像。可以使用Matlab
算法中的时间复杂度和空间复杂度 CM莫问人工智能算法常见概念算法人工智能 python 时间复杂度空间复杂度
一、背景随着人工智能的纵深发展，我们会发现现在做算法很多时候都是通过掉包来解决问题了。Torch或者Tensorflow之类的深度学习库大大减少了算法工程师的工作量，而且在张量运算、反向传播等环节，这些深度学习库的模块设计也尽最大可能地降低了计算的时间和空间复杂度，从而不需要我们额外进行过多的干预。如果不是科班读计算机相关专业的，相信不少朋友第一次听说时间复杂度和空间复杂度的概念是在找工作刷lee
归并排序(Python) 编程可可西里 python 开发语言算法排序算法
1.算法步骤首先考虑一个问题:两个有序列表如何合并成一个列表A=[1,3,5,6,7,12]B=[6.7.9.11]1.构建一个result=[]2.当A非空且B非空：比较A[0]和B[0]result添加较小的那个元素，并从原始数组弹出3.如果A非空,把A添加到result末尾4.如果B非空,把B添加到result末尾1.先把数组分成两部分2.每部分递归处理变成有序3.将两个有序列表合并起来2.
【2025 ODA teigha .NET系列开发教程第五章】给CAD实体添加附属数据XDATA，包括源码三好学生～张旺 ODA Teigha .NET开发教程 .net
系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档2025ODAteigha.NET系列开发教程系列文章目录AutoCADXData扩展数据开发指南什么是XData？XData的两种存储方式1.全局字典存储(XRecord)2.实体附加存储步骤1：注册应
25/1/22 算法笔记＜ROS2＞ TF变换青椒大仙KI11 笔记
TF（Transform）是ROS（RobotOperatingSystem）中的一个核心功能，用于管理和发布坐标系之间的变换关系。TF的主要作用是描述机器人系统中各个部分（如传感器、执行器、底盘等）之间的位置和姿态关系，从而实现数据的统一和模块化。静态TF（StaticTransform）是ROS（RobotOperatingSystem）中用于描述两个坐标系之间固定不变的变换关系的一种机制。静
架构学习第四周--高可用与NoSQL数据库 Mr.王835 nosql linux
目录一、HAProxy介绍二、HAProxy基本使用2.1，HAProxy调度算法2.2，HAProxy高级用法三、高可用Keepalived介绍3.1，Keepalived介绍3.2，Keepalived单主架构实现3.3，脑裂四、Keepalived实例--实现单主架构的LVS-DR模型五、实例--通过Keepalived实现HAProxy高可用六、NoSQL数据库Redis6.1，Redis
c语言通讯录二分查找,C语言程序设计通讯录程序.doc weixin_39674028 c语言通讯录二分查找
《C语言程序设计通讯录程序.doc》由会员分享，可在线阅读，更多相关《C语言程序设计通讯录程序.doc(28页珍藏版)》请在人人文库网上搜索。1、目录：课程设计任务书2目录：3一、目的4二、基本情况5三、时间安排5四、设计和调试过程规范化要求5五、设计内容和设计要求6六、考核方式7一通讯录的主要功能:8一、问题描述:8二、功能要求:8三、算法提示:8四、测试数据:9二、课题的主要功能模块划分：9三
使用神经网络做二分类预测 weixin_33816300 人工智能 python matlab
不想整理代码了。先给个结果图：train0loss:1838.0616train100loss:1441.5283train200loss:1299.4546train300loss:934.36536train400loss:506.06702train500loss:322.9782train600loss:271.5825train700loss:360.091train800loss:23
360智算中心万卡GPU集群架构分析科技互联人生科技数码人工智能硬件架构系统架构人工智能
360智算中心：万卡GPU集群落地实践 360智算中心是一个融合了人工智能、异构计算、大数据、高性能网络、AI平台等多种技术的综合计算设施，旨在为各类复杂的AI计算任务提供高效、智能化的算力支持。360智算中心不仅具备强大的计算和数据处理能力，还结合了AI开发平台，使得计算资源的使用更加高效和智能化。360内部对于智算中心的核心诉求是性能和稳定性，本文将深入探讨3
Kotlin开发（一）：Google 亲儿子 Kotlin 到底有多香？看完你就懂了刘争Stanley Kotlin编程探索之旅 android kotlin 开发语言
引言在这个技术更新日新月异的时代，Android开发者们对编程语言的选择尤为重要。Kotlin，这个名字听起来像某种北欧神话武器，但其实是Google推崇的安卓开发神器。它不仅让代码更简洁优雅，还能帮你摆脱“Bug狂魔”的称号。作为一名Android开发者，如果还没用过Kotlin，那简直就是错过了一个亿！今天这篇文章，就带你从零到一，全面解析为什么Kotlin是Android开发的首选语言。一、
数据不出境的SSL证书有吗？ Gworg ssl 网络协议网络
在中国没有数据不出境的SSL证书，原因是世界上所有可信的SSL证书必须经过Webtrust认证和CA/B组织，没有经过认证和参加组织的CA属于不可信SSL证书或自签名SSL证书。相比能看到这篇文章的肯定被人忽悠得不轻或者就是政策解读错了，国产SSL证书再次说一下除了CFCA就没有了，所以数据不出境的SSL证书除了CFCA，目前还没有一家机构可以做到，除非你选择的是国密算法SSL证书，但国密算法SS
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
kaggle入门级竞赛Spaceship Titanic LIghtgbm+Optuna调参机器学习司猫白机器学习实战机器学习 python 集成学习 scikit-learn
kaggle入门级竞赛SpaceshipTitanic简介数据介绍数据集描述数据字段描述train.csv-约三分之二（~8700）乘客的个人记录，用作培训数据。test.csv-剩余三分之一（~4300）乘客的个人记录，用作测试数据。您的任务是预测Transported该集合中乘客的价值。Sample_submission.csv-格式正确的提交文件。代码分类变量optuna算法简介简介欢迎来到
Neural Architecture Search (NAS) 原理和应用 weixin_58349913 python
NeuralArchitectureSearch(NAS)原理和应用NeuralArchitectureSearch(NAS)是一种自动化设计神经网络架构的技术。它通过搜索空间中的不同架构配置来找到最优或接近最优的神经网络结构，从而减少人工设计网络结构的工作量。NAS的目标是通过自动化的方式获得比手工设计更高效、准确的模型架构，特别适用于对网络架构要求较高的任务。1.NAS的基本原理NAS的核心思
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
数据结构——算法基础小禾苗_ 数据结构
1、概念算法(Algorithm)用来描述对特定问题的求解步骤，它是指令的有限序列，其中每一条指令代表一个或多个操作算法的概念在计算机科学领域中几乎无处不在，在各种计算机系统的实现中，算法的设计往往处于核心的位置。计算机的问世是20世纪算法是计算机科学的重要基础，就像算盘一样，人们需要为计算机编制各种各样的“口诀”即算法，才能使其工作软件(项目)=程序+文档程序=数据结构+算法软件(项目)=数据结
掌握 JavaScript：从基础到高级，全面提升编程技能跟着小郑学前端 javascript 开发语言 ecmascript
JavaScript是一种广泛应用于网页开发的编程语言，它使网页具有动态交互的能力。作为Web开发的核心技术之一，掌握JavaScript基础是每位开发者的必备技能。本文将介绍JavaScript的基础知识，包括数据类型、运算符、控制结构、函数等内容，并通过代码示例帮助大家理解。1.JavaScript数据类型JavaScript主要有以下几种数据类型：数据类型描述示例String字符串类型，用于
Python 实现 RGB 和 HSV 相互转换算法传说里的故事 python 算法开发语言
Python实现RGB和HSV相互转换算法在图像处理领域，RGB和HSV是两种最常用的颜色空间。RGB是红绿蓝三原色的组合，HSV是色调、饱和度和亮度的组合。在不同应用场景下，需要将RGB和HSV进行相互转换。下面给出Python实现RGB和HSV相互转换的算法，并附上完整的源码。首先，我们需要导入colorsys库。这个库提供了许多颜色空间的转换函数。接下来，我们定义RGBToHSV和HSVTo
让旅游更智能：基于AR的旅游导览应用解析 Echo_Wish Python 笔记 Python算法旅游 ar restful
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

2022图机器学习必读的11大研究趋势和方向: 微分方程/子图表示/图谱理论/非对称/动态性/鲁棒性/通用性/强化学习/图量子等...

你可能感兴趣的:(神经网络,大数据,算法,编程语言,机器学习)