数据派THU

用深度学习解决旅行推销员问题，研究者走到哪一步了？

来源：机器之心
本文约2600字，建议阅读9分钟
本文分析了深度学习在路由问题方面的最新进展，并提供了新的方向来启发今后的研究。

最近，针对旅行推销员等组合优化问题开发神经网络驱动的求解器引起了学术界的极大兴趣。这篇博文介绍了一个神经组合优化步骤，将几个最近提出的模型架构和学习范式统一到一个框架中。透过这一系列步骤，作者分析了深度学习在路由问题方面的最新进展，并提供了新的方向来启发今后的研究，以创造实际的价值。

组合优化问题的背景

组合优化是数学和计算机科学交叉领域的一个实用领域，旨在解决 NP 难的约束优化问题。NP 难问题的挑战性在于详尽地寻找 NP 难问题的解超出了现代计算机的限制，因此不可能在大规模问题上最优地解决 NP 难问题。

我们为什么要关心这个问题？因为针对流行问题的稳健可靠的近似算法具有巨大的实际应用价值，并且也是现代产业的支柱。例如，旅行推销员问题 (TSP) 是最流行的组合优化问题 (COP)，从物流和调度到基因组学和系统生物学等多种应用中都有出现。

旅行推销员问题是如此著名，或者说难以攻克，甚至有专门的 xkcd 漫画！

TSP 和路由问题

TSP 也是路由问题的经典示例——路由问题是一类 COP，它需要一系列节点（例如城市）或边（例如城市之间的道路）以特定顺序遍历，同时需要满足一组约束或优化一组变量。TSP 要求按照确保所有节点都被访问一次的顺序遍历一组边。从算法的角度来看，我们的销售人员的最佳「旅行」路线是一系列选定的边，这些边满足了哈密顿循环中的最小距离或时间，请参见图 1 中的说明。

图 1：TSP 提出以下问题：给定一个城市列表和每对城市之间的距离，销售人员访问每个城市并返回出发城市的最短路线是什么？（来源：MathGifs）

在现实世界和实际场景中，路由问题或车辆路由问题 (VRP) 可能会涉及超出普通的 TSP 的挑战性约束。例如，带有时间窗口的 TSP (TSPTW) 将「时间窗口」约束添加到 TSP 图中的节点。这意味着某些节点只能在固定的时间间隔内访问。另一种变体是，容量车辆路线问题 (CVRP) ，旨在为访问一组客户（即城市）的车队（即多个销售人员）找到最佳路线，每辆车都具有最大承载能力。

图 2：TSP 和相关的车辆路径问题类别。VRP 的约束条件和 TSP 的不同，该图呈现了相对充分研究的那些约束条件。在真实世界中可能存在具有更复杂和非标准约束的类 VRP 问题！（来源：改编自 Benslimane 和 Benadada，2014 年）

用深度学习解决路由问题

为路由问题开发可靠的算法和求解器需要大量的专家直觉和多年的反复试验。例如，线性规划、切割平面算法和分支定界问题中最先进的 TSP 求解器 Concorde 耗费了人们 50 多年的时间才得到；这是一段关于其历史的鼓舞人心的视频（https://www.youtube.com/watch?v=q8nQTNvCrjE）。Concorde 可以找到多达数万个节点的最优解，但执行时间极长。正如读者所想象的那样，为复杂的 VRP 设计算法会更具挑战性，也更耗时，尤其是在现实世界的限制条件下，例如混合容量或时间窗口问题。

于是，机器学习社区开始关注以下问题：

我们可以使用深度学习来让解决 COP 所需的专家直觉流程自动化，甚至增强专家直觉吗？

有关更深入的动机，请参阅 Mila 的这项精妙调查：https://arxiv.org/abs/1811.06128

神经组合优化

如果把 COP 问题比作一根钉子，那么神经组合优化可以说是一种尝试使用深度学习方法来解决问题的锤子。神经网络经过训练之后，可以直接从问题实例本身中学习来产生 COP 的近似解。这一系列研究始于 Google Brain 的开创性 Seq2seq 指针网络和使用强化学习来实现神经组合优化的论文。如今，图神经网络通常是深度学习驱动的求解器的核心架构选择，因为它们解决了这些问题相关的图结构。

神经组合优化旨在通过以下方式改进传统的 COP 求解器：

非手工的启发式方法。神经网络不需要应用专家手动设计启发式和规则，而是通过模仿最佳求解器或通过强化学习来学习这些启发式和规则（下一节中展示了一个示例）。
GPU 快速推理。对于问题规模较大的情况，传统求解器的执行时间通常很长，例如 Concorde 用了 7.5 个月的时间解决了拥有 109,399 个节点的最大 TSP。另一方面，一旦用来近似求解 COP 的神经网络训练完成，那么使用的时候就具有显着有利的时间复杂度，并且可以通过 GPU 进行并行化。这使得它们非常适合解决实时决策问题，尤其是路由问题。
应对新颖且研究不足的 COP。神经组合优化可以显著加快针对具有深奥约束的新问题或未研究问题的特定 COP 求解器的开发进度。此类问题经常出现在科学级的发现或计算机体系结构中，一个令人兴奋的成功例子是谷歌的芯片设计系统，它将为下一代 TPU 提供动力。你没看错——下一个运行神经网络的 TPU 芯片是由神经网络设计的！

神经组合优化步骤

使用 TSP 作为典型示例，我们现在提出一个通用的神经组合优化步骤，可用于表征现代深度学习驱动的几个路由问题的方法。

最先进的 TSP 方法将城市的原始坐标作为输入，并利用 GNN 或 Transformer 结合经典图搜索算法来建设性地构建近似解。其架构可以大致分为：（1）自回归模型，以逐步的方式构建解集；(2) 非自回归模型，一次性产生所有解。可以通过监督学习或通过强化学习最小化 TSP 遍历的长度来训练模型以模仿最佳求解器。

图 3：神经组合优化步骤（来源：Joshi 等人，2021）

Joshi 等人在 2021 年提出的 5 阶段步骤将突出的模型架构和学习范式整合到一个统一的框架中。这个步骤将使我们能够剖析和分析深度学习在路由问题方面的最新发展，并为激励未来的研究提供新的方向。

第一步：通过图定义问题

图 4：问题定义：TSP 是通过城市 / 节点的全连接图定义的，此图可以进一步稀疏化

TSP 是通过一个全连接图定义的，其中节点对应于城市，边表示它们之间的道路。该图可以通过启发式算法（例如 k-nn 最近邻算法）进行稀疏化。这使模型能够扩展到所有节点的成对计算都难以处理的大型实例中 [Khalil 等人，2017 年]，或者通过减少搜索空间来更快地学习 [Joshi 等人，2019 年]。

第二步：获取图节点和边的隐空间嵌入

图 5：图嵌入：每个图节点的嵌入是使用图神经网络编码器获得的，该编码器通过递归聚合来自每个节点的邻居的特征来构建局部结构特征

GNN 或 Transformer 编码器将 TSP 图中的每个节点和边，或者在两者中选择一个，作为输入来计算隐空间表示或嵌入特征。在每一层当中，节点从其邻居那里收集特征，再通过递归消息传递来表示局部图结构。堆叠 L 层后，网络就能从每个节点的 L 跳邻域中构建节点的特征。

Transformers [Deudon et al., 2018, Kool et al., 2019] 和 Gated Graph ConvNets [Joshi et al., 2019] 等各向异性和基于注意力的 GNN 已成为编码路由问题的默认选择。邻域聚合期间的注意力机制至关重要，因为它允许每个节点根据其对解决手头任务的相对重要性来权衡其邻居节点。

重要的是，Transformer 编码器可以看作是全连接图上的注意力 GNN，即图注意力网络 (GAT)。请参阅此博客文章以获得直观的解释。

第三、四步：将嵌入转换为离散解

图 5：解码和搜索：为每个节点或每条边分配属于解集的概率（这里，MLP 对每条边进行预测以获得边概率的「热力图」），然后转换为离散决策中经典的图搜索技术，例如贪心搜索或束搜索

一旦图的节点和边被编码为隐空间表示，我们必须将它们解码为离散的 TSP 解决方法。具体来说，可以通过两步过程完成：首先，将概率分配给每个节点或每条边来将节点或边添加到解集当中，无论是相互独立地（即非自回归解码）或是通过图遍历有条件地（即自回归解码）。接下来，通过经典的图搜索技术（例如由概率预测引导的贪心搜索或束搜索）将预测概率转换为离散决策（稍后我们将在讨论近期趋势和未来方向时，讨论更多关于图搜索的内容）。

解码器的选择需要在数据效率和实现效率之间权衡：自回归解码器 [Kool et al., 2019] 将 TSP 转换为 Seq2Seq 模型，或基于一组无序城市节点的有序旅游路线的语言翻译任务。他们通过每次选择一个节点来明确地模拟路由问题的顺序归纳偏差。另一方面，非自回归解码器 [Joshi et al., 2019] 将 TSP 视为生成边缘概率热力图的任务。NAR 方法明显更快，更适合实时推理，因为它是一次性而不是逐步地生成预测。然而，NAR 方法忽略了 TSP 的顺序性，与 AR 解码相比，训练效率可能较低 [Joshi 等人，2021]。

第五步：模型训练

最后，整个编码器 - 解码器模型以端到端的方式进行训练，就像用于计算机视觉或自然语言处理的深度学习模型一样。在最简单的情况下，可以通过模仿最优求解器（即通过监督学习）来训练模型以产生接近最优的解。对于 TSP，Concrode 求解器用于为数百万个随机实例生成最佳旅游路线的有标签训练数据集。带有 AR 解码器的模型通过强制教学（teacher-forcing ）模式进行训练，来输出节点的最佳旅行序列 [Vinyals et al., 2015]，而带有 NAR 解码器的模型经过训练后，可以从未遍历的边集中识别出在旅行期间遍历的边 [Joshi et al., 2019]。

然而，为监督学习创建标记数据集是一个昂贵且耗时的过程。特别是对于大规模问题实例，最佳求解器在准确性上的保证可能不复存在，这会导致用于监督训练的解决方案不精确。从实践和理论的角度来看，这远非是理想的方式 [Yehuda et al., 2020]。

对于未充分研究的问题来说，在缺乏标准解决方案的情况下，强化学习通常是一种优雅的替代方案。由于路由问题通常需要顺序决策以最小化特定于问题的成本函数（例如 TSP 的旅行长度），它们可以优雅地投入 RL 框架中，该框架训练智能体以最大化奖励函数（损失函数的负值） . 带有 AR 解码器的模型可以通过标准策略梯度算法 [Kool et al., 2019] 或 Q 学习 [Khalil et al., 2017] 进行训练。

各阶段中的成果简介

我们可以通过 5 阶段步骤来描述 TSP 深度学习中的杰出成果。回想一下，步骤包括：（1）问题定义→（2）图嵌入→（3）解码→（4）解搜索→（5）策略学习。下表从 Oriol Vinyals 及其合作者发表的指针网络论文开始介绍，红色突出表示该论文具有主要创新和贡献。

未来工作的最新进展和途径

有了统一的 5 阶段步骤，我们接下来重点介绍深度学习路由问题的一些最新进展和趋势。同时还将提供一些未来的研究方向，重点探讨如何提高对大规模和真实世界实例的泛化能力。

利用等方差和对称性

作为最有影响力的早期作品之一，自回归注意力模型 [Kool et al., 2019] 将 TSP 视为可以用 Seq2Seq 解决的语言翻译问题，并将 TSP 旅行顺序构建为城市排列。该公式的一个直接缺点是它没有考虑路由问题的潜在对称性。

图 6：一般来说，TSP 有一个唯一的最优解 (L)。然而，在自回归公式下，当解表示为节点序列时，存在多个最优排列 (R)。（来源：Kwon 等人，2020）

POMO: Policy Optimization with Multiple Optima [Kwon et al., 2020] 建议在建设性自回归公式中利用起始城市的不变性。他们训练了与之前相同的注意力模型，但不同之处在于他们使用了一种新的强化学习算法（上述步骤中的第 5 步），该算法利用了多个最优旅行排列。

图 7：在旋转、反射和转换后，城市坐标的欧几里得对称群的 TSP 解保持不变。将这些对称性纳入模型可能是解决大规模 TSP 的原则性方法

同样地，Ouyang 等人在 2021 年对注意力模型进行了升级，考虑了输入城市坐标的旋转、反射和平移（即欧几里得对称群）的不变性。他们提出了一种自回归方法，通过同时在问题定义阶段（步骤 1）执行数据增强并在图形编码（步骤 2）期间使用相对坐标来确保不变性。他们在 TSPLib 数据集上进行的从随机实例到现实世界的零样本泛化实验显示他们的模型具有很好的效果。

未来的工作可能会在架构设计上遵循几何深度学习 (GDL) 蓝图。GDL 告诉我们要明确考虑数据或问题的对称性和归纳偏差，并将其结合起来。由于路由问题需要被嵌入在欧几里得坐标中，以及路由是循环的，因此将这些约束直接纳入模型架构或学习范式可能是一种原则性方法，可以提高对比训练期间更大的大规模实例的泛化能力。

改进后的图搜索算法

另一个有影响力的研究方向是一次性非自回归图卷积网络方法 [Joshi et al., 2019]。最近的几篇论文提出保留相同的门控 GCN 编码器（步骤 2），同时用更强大和灵活的图搜索算法替换束搜索组件（步骤 4），例如动态规划 [Kool et al., 2021] 或蒙特卡洛树搜索 (MCTS) [Fu et al., 2020]。

图 8：门控 GCN 编码器 [Joshi 等人，2019 年] 可用于为 TSP、CVRP 和 TSPTW 生成边预测「热力图」（透明红色）。这些可以由 DP 或 MCTS 进一步处理以输出路由（纯色）。GCN 从本质上减少了复杂搜索算法的解搜索空间，复杂搜索算法在搜索所有可能的路线时可能难以处理。（资料来源：Kool 等人，2021 年）

Fu 等人提出的 GCN + MCTS 框架有一种非常有趣的方法，该方法可以在很小的 TSP 问题上有效地训练模型，并以零样本的方式（类似 Joshi 等人最初探究的 GCN + 束搜索方式）成功地将学习的策略转移到更大的图上。他们通过更新问题定义（步骤 1）来确保 GCN 编码器的预测结果可以在 TSP 从小到大变化时仍然具有泛化能力：规模较大的问题实例被表示为许多较小的子图，这些子图的大小与 GCN 的训练图相同，然后在执行 MCTS 之前合并 GCN 的边预测结果。

图 9：GCN + MCTS 框架 [Fu et al., 2020] 将大型 TSP 问题表示为一组与用于训练的 GCN 的图大小相同的规模较小的子图。将 GCN 预测得到的子图的边热力图合并在一起，可以获得原图的热图。这种分而治之的方法确保了 GCN 的嵌入和预测能够很好地从较小的实例推广到较大的实例。（来源：Fu et al., 2020）

这种分而治之的策略最初由 Nowak 等人在 2018 年提出，以确保 GNN 的嵌入和预测能够很好地泛化从较小到较大的 TSP 实例（最多 10,000 个节点）。将 GNN、分而治之和搜索策略融合在一起，来处理多达 3000 个节点的大规模 CVRP 问题同样充满无限可能。[Li et al., 2021]。

总体而言，这一系列的工作表明，模型的神经元和符号 / 搜索组件的设计之间的更强耦合对于分布外泛化至关重要 [Lamb 等人，2020]。然而，同样值得注意的是，在 GPU 上实现图搜索的设计高度定制化和并行化，可能对每个新问题都是一种挑战。

学习改进次优解

最近，从 Chen 等人在 2019 的工作和 Wu 等人在 2021 年的工作开始，许多论文探索了建设性的 AR 和 NAR 解的替代方案，包括迭代改进（次优）解学习或局部搜索学习。其他著名论文包括 Cappart et al., 2021, da Costa et al., 2020, Ma et al., 2021, Xin et al., 2021 和 Hudson et al., 2021.。

图 10：通过在局部搜索算法中的指导决策来学习改进次优 TSP 解的架构。(a) 原始的 Transformer 编码器 - 解码器架构 [Wu et al., 2021]，该方法使用正弦位置编码来表示当前的次优旅行排列；(b) Ma et al., 2021 通过在对称性问题上做了进一步的升级：具有可学习的位置编码的双端 Transformer 编码器 - 解码器，能够捕捉 TSP 旅行的循环性质；(c) 正弦曲线与周期性位置编码的可视化

在所有这些工作中，由于深度学习用于指导经典局部搜索算法中的决策（这些算法被设计为无论问题规模如何都能工作），因此与建设性方法相比，这种方法隐含地导致对更大问题实例的更好的零样本泛化。实际来说，这是一个非常理想的属性，因为在非常大或真实世界的 TSP 实例上进行训练可能很棘手。

值得注意的是，NeuroLKH [Xin et al., 2021] 使用通过 GNN 生成的边概率热力图来改进经典的 Lin-Kernighan-Helsgaun 算法，并展示了对具有 5000 个节点的 TSP 以及跨对 TSPLib 数据集中，实例的强大零样本泛化能力。

这项工作成果的限制之一是需要事先手工设计的局部搜索算法，对于新的或未充分研究的问题可能是会缺少的。另一方面，通过在解码和搜索过程中实施约束，建设性的方法可以说更容易适应新问题。

促进泛化的学习范式

未来的工作可以着眼于新的学习范式（步骤 5），这些范式明确关注监督和强化学习之外的泛化，例如 Hottung et al., 2020 探索了自动编码器目标，以学习路由问题解的连续空间，而 Geisler et al., 2021 训练神经求解器，使其对对抗性扰动具有鲁棒性。

目前，大多数论文都建议在非常小的随机 TSP 上有效地训练模型，然后以零样本的方式将学习到的策略转移到更大的图和真实世界的实例中。合乎逻辑的下一步是在少数特定问题实例上微调模型。Hottung et al., 2021 在 2021 年迈出了第一步，建议通过主动搜索为每个特定问题实例微调模型参数的子集。在未来的工作中，将微调作为元学习问题进行探索可能会很有趣，元学习问题的目标是训练模型参数，用于快速适应新的数据分布和问题。

另一个有趣的可以探索的方向是通过对流行的路由问题（如 TSP 和 CVPR）进行多任务预训练，然后针对特定问题的微调来解决具有挑战性约束的未充分研究的路由问题。与自然语言处理中作为预训练目标的语言建模类似，路由预训练的目标是学习通常来说会有用的潜在表示，这些表示可以很好地转移到新的路由问题上。

改进后的评估协议

除了算法创新之外，社区一再呼吁推出更现实的评估协议，这可以推动现实世界路由问题的进步和工业界的落实 [Francois et al., 2019, Yehuda et al., 2020]。最近， Accorsi et al., 2021 为实验设计和与经典运筹学 (OR) 技术的比较提供了一套权威指南。他们希望对标准化基准进行公平和严格的比较将成为将深度学习技术集成到工业路由求解器中的第一步。

总的来说，令人鼓舞的是，近期的论文不仅显示了对微小的随机 TSP 实例的轻微性能提升，而且还采用了 TSPLib 和 CVPRLib 等真实世界的基准测试数据集。此类路由问题集合包含来自全球城市和道路网络的图表及其精确解决方案，并已成为 OR 社区中新求解器的标准测试平台。

同时，我们必须在其他论文都在使用的前 n 个 TSPLib 或 CVPRLib 实例上不「过拟合」。因此，更好的合成数据集与公平的基准测试进展密切相关，例如 Queiroga et al., 2021 (https://openreview.net/forum?id=yHiMXKN6nTl) 最近提出了一个新的合成了 10,000 个 CVPR 测试实例的库。

图 11：关注 ML4CO 等社区竞赛能有效地跟踪研究进展。（来源：ML4CO 网站）。对新构造的现实世界数据集进行定期竞赛，例如 NeurIPS 2021 的 ML4CO 竞赛和 IJCAI 2021 的 AI4TSP，也是跟踪深度学习和路由问题交叉点进展的一个有效手段

我们强烈呼吁能够在 YouTube 上获取来自 ML4CO、NeurIPS 2021 的有价值的小组讨论和演讲。

总结

这篇博文介绍了一系列神经组合优化步骤，这些步骤将最近关于深度学习的论文统一到一个单一的框架中。然后，通过此框架的视角，我们分析和剖析最近的研究进展，并预测未来研究的方向。

最后一点想说的是，神经组合优化的更深刻的研究动机可能并不是为了在经过充分研究的路由问题上胜过经典方法。神经网络可以用作解决以前未遇到的 NP 难问题的通用工具，尤其是那些对于设计启发式算法而言并非微不足道的问题。我们赞叹神经组合优化最近在设计计算机芯片、优化通信网络和基因组重建方面的应用，并期待未来有更多有价值的应用！

原文链接：https://www.chaitjo.com/post/deep-learning-for-routing-problems/?continueFlag=b220d49bda26d4033730216fbc9275d5

编辑：黄继彦

校对：龚力

云上配送革命：亚矩云手机如何重塑Uber Eats的全球外卖生态云云321 智能手机重构 web3 android 矩阵
当UberEats在东京涩谷的暴雨中因配送延迟被用户差评，当巴西圣保罗的贫民窟因网络信号差导致订单流失，当欧洲司机因高昂的燃油成本抗议平台抽成——全球外卖行业的增长瓶颈，正卡在“物理世界”与“数字世界”的断层带上。而亚矩云手机以“云端算力+AI调度+边缘网络”的技术组合，正在为UberEats构建一张覆盖6000多个城市的“云端配送神经网络”，重新定义外卖行业的效率、成本与用户体验边界。一、动态定
“Redis缓存：掌握Redis常用五大数据类型“ 南石. 后端 #MySQL数据库进阶 #Redis 缓存 redis 笔记
目录1、Redis中String字符串1.1常用命令解释1.2原子性1.3具有原子性的常用命令1.4String数据结构2、Redis常用数据类型-List列表2.1概念2.2常用命令2.3数据结构3、Redis常用数据类型-Set集合3.1概念3.2常用命令3.3数据结构4、Redis常用数据类型-Hash哈希4.1概念4.2常用命令4.3数据结构5、Redis常用数据类型-Zset有序集合5.
AI产品经理技术篇：AI领域常用术语解析让我看看好学吗人工智能产品经理机器学习深度学习学习
作为AI产品经理，深入理解人工智能领域的核心术语是高效沟通、需求定义和产品落地的关键。无论是与算法工程师协作优化模型，还是向业务方解释技术方案，准确掌握专业术语能显著提升决策效率，避免因概念混淆导致的开发偏差。本文系统梳理了模型与算法、NLP（自然语言处理）、CV（计算机视觉）、数据处理、核心评估指标等领域的核心术语，帮助产品经理快速构建AI技术认知框架。目录1.基础概念2.模型与算法3.自然语言
【牛客刷题HJ16】购物单 the_sunshine6 牛客华为机试动态规划 java 算法动态规划 intellij-idea
目录一、题目描述二、题目分析1、题目理解2、题目分析（1）首先，将物品类准备好（2）然后，对v、p、q进行初始化（3）对动态规划数组进行赋值（填表）三、总结一、题目描述来源：购物单_牛客题霸_牛客网二、题目分析该题类似于0-1背包问题，关于0-1背包请看0-1背包-动态规划算法_哔哩哔哩_bilibili1、题目理解1、购买附件必须买主件，且一个主件最多有两个附件，每件物品只能购买一次；2、每件物
2025B卷最新华为OD机考指南宝典（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为OD机试 python 2025B卷算法华为od
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
【持续更新】2025华为OD机试2025A卷机考真题库清单含考点说明（已更新600+题）（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 2025A卷华为OD机试
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年3月16日，华为OD机试已经将华为OD机试（E卷）切换为2025A卷。目前正在考的是2025A卷，按照华为OD往常的
CentOS系统高效部署fastGPT全攻略挑战者666888 linux 常用工具软件 centos python linux
文章目录一、引言二、环境准备系统要求;基础依赖安装Python环境配置三、fastGPT部署流程源码获取与验证依赖库安装模型文件部署四、系统配置优化服务端口配置;安全加固措施;资源限制调整五、服务启动与管理直接启动方式系统服务化部署;日志监控方案六、验证与测试健康检查端点测试API功能测试用例压力测试方案一、引言fastGPT是一款高效、灵活的大语言模型应用框架，凭借其出色的推理速度和良好的扩展性
使用python代码调用dify 奋斗小刘123 python 前端开发语言
importreimportjsonimportrequestsdefdify_data(inputstr,num):api_url="*****************"api_key="*****************"#组装数据，num和input为输入的数据，同时在dify定义data={"inputs":{"num":num,"input":inputstr},"response_mo
元宇宙养老社区:数字化照护的创新实践 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《元宇宙养老社区：数字化照护的创新实践》关键词元宇宙养老社区数字化照护虚拟现实人工智能大数据物联网摘要本文深入探讨了元宇宙养老社区的概念、技术架构及其在数字化照护中的应用。通过分析虚拟现实、人工智能、大数据和物联网等核心技术，本文详细阐述了元宇宙养老社区的架构设计、项目实施、运营管理与用户体验优化。同时，本文还展望了元宇宙养老社区的潜在市场、技术发展趋势以及未来挑战与机遇。文章目录《元宇宙养老社区
机器学习-三大SOTA Boosting算法总结和调优小新学习屋机器学习机器学习 boosting 集成学习决策树人工智能
参考书籍：《机器学习公式推导和代码实现》书籍页码：P197～205简介除了深度学习适用的文本、图像、语音、视频等非结构化数据，对于训练样本较少的结构化数据，Boosting算法仍是第一选择。XGBoost、LightGBM、CatBoost是目前经典的SOTABoosting算法算法对比维度XGBoostLightGBMCatBoos说明算法的继承性是对GBDT的改进是对XGBoost的改进是对X
2025 年使用 Python 和 Go 解决 Cloudflare 问题 ForRunner123 python golang 开发语言
作为一名从事网络自动化和爬取工作的开发者，我亲眼目睹了日益复杂的安全性措施带来的挑战。其中一项挑战是Cloudflare的TurnstileCAPTCHA系统，目前该系统已在全球2600多万个网站上使用。这种先进的解决方案重新定义了我们对机器人检测的处理方式，它具有出色的能力，可以过滤掉80%的恶意流量，同时允许真实用户无需繁琐的谜题即可浏览网站。在2025年，我发现掌握使用Python和Go等编
【Python】Python常用运算符及优先级（算术、赋值、关系、逻辑、成员、身份）恰似.322 java 前端 javascript python html django flask
目录一、运算符和表达式1.算术运算符2.赋值运算符3.关系运算符4.逻辑运算符5.成员运算符6.身份运算符7.运算符优先级一、运算符和表达式1.算术运算符运算符说明+加-减*乘/除//取整%求余（取模）**求幂（次方）注意：如果整数和浮点数进行运算，结果都是浮点数，换句话说，但凡表达式中出现浮点数进行数学运算，结果都是浮点数只要是除运算，结果都是浮点数取整的结果为除的结果的整数部分，不涉及四舍五入
python系列：[Python系列-26]：importlib - 动态导入其他python模块库坦笑&&life #python python 开发语言
[Python系列-26]：importlib-动态导入其他python模块库[Python系列-26]：importlib-动态导入其他python模块库第1章模块导入概述1.1概述1.2模块的作用（1）代码重用（2）避免变量名的冲突（3）便于组织大规模的工程文件第2章导入其他模块程序的方式2.1import文件名（1）导入库的方法（2）Importas语句（2）使用库的方法2.2from-im
python import 路径_importlib weixin_39960147 python import 路径
3.7新版功能.这个模块使得Python的导入系统提供了访问*包*内的*资源*的功能。如果能够导入一个包，那么就能够访问那个包里面的资源。资源可以以二进制或文本模式方式被打开或读取。资源非常类似于目录内部的文件，要牢记的是这仅仅是一个比喻。资源和包不是与文件系统上的物理文件和目录一样存在着。注解Thismoduleprovidesfunctionalitysimilartopkg_resource
在python中实现动态导入模块importlib.import_module weixin_33985507 python
有时候，我们很需要在程序运行的过程中，根据变量或者配置动态的决定导入哪个模块。假设我们需要导入的模块module_12定义在subPack1文件夹下面，内容如下。deffuncA12():print('funcA12inmodule_12')returnimportosprintos.path.join(os.path.abspath(os.path.dirname(__file__)),('te
【python知识】importlib包详解无水先生 AI原理和python实现人工智能综合 python 数据分析
importlib—Theimplementationofimport—Python3.11.3documentation目录一、说明二、模块导入简介2.1最简单的importlib用途2.2importlib包的目的有三个2.3import_module()和__import__()三、高级模块使用3.1动态引入3.2模块引入检查3.3从源文件中引入3.4import_from_github_c
《Mac 用户必看：通过命令行升级 pip 到最新版本的正确方法及下载第三方模块的应用手册》
问题描述：当我用MAC下载PythonPandas等第三方模块时，终端出现WARNING:Youareusingpipversion20.2.3;however,version25.1.1isavailable.Youshouldconsiderupgradingviathe'/Library/Frameworks/Python.framework/Versions/3.9/bin/python3
Python咒语大全（学习笔记与使用指南）桑迪Sandy.Q Python python 开发语言
目录字符串格式限制，%xd（整数），%x.yf（小数点浮点数）f“内容{变量}快速格式化案例1：股价预测INPUT语句案例2：INPUT登陆界面语句布尔类型函数基础运用案例3:比较运算符的运用IF语句基本格式案例4:IF语句+INPUT语句练习案例5:IFELSE语句案例6:IFELIFELSE语句案例7:猜数字小游戏案例8:IFELSE嵌套规则案例9:IFELSE嵌套（符合工龄的员工可享受旅游）
高考计算机专业选择万能小贤哥 python 人工智能机器学习高考
高考计算机专业选择：从认知到决策的全面指南在数字经济蓬勃发展的今天，计算机专业已成为高考志愿填报的热门之选。但计算机领域分支众多，专业名称相近却差异显著，如何结合自身特点做出合适选择，需要理性分析与规划。一、计算机类专业的“家族图谱”计算机类专业并非单一学科，而是包含多个细分方向，不同专业培养目标和侧重领域各有不同：-计算机科学与技术：这是计算机领域的“基础款”，涵盖计算机原理、编程语言、算法、操
c语言程序设计基础教案,《c语言编程基础》电子教案 weixin_39906114 c语言程序设计基础教案
《c语言编程基础》电子教案宾县职业技术教育中心学校教导处制课题(内容)1.1C语言简史及特点课时1教学任务分析知识技能通过本节课的教学，使学生了解并熟悉编程语言C的发展历史、特点及其种类和适用范围。过程与方法通过C语言的发展，引出C语言的特点，从而激学生学好本门课程的兴趣。教学目标情感态度培养学生的动脑思考能力重点C语言的特点难点C语言的特点课前准备教具学具补充材料教材、教案笔记教学流程设计教师活
Python音频库龅牙内马尔
Python音频库Python有一些很棒的音频处理库，比如Librosa和PyAudio。还有一些内置的模块（内置库wave）用于一些基本的音频功能。我们将主要使用两个库进行音频采集和分析：1.LibrosaLibrosa是一个用于音频、音乐分析、处理的python工具包，一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有，功能十分强大。功能实现：读取音频提取特征提取Log-MelSpect
使用pyarmor对python文件进行加密 robot_future ubuntu pycharm linux
在pycharm上开发python后，需要对python文件进行加密。进行了调研，采用pyarmor进行加密。PyArmor是一个用于加密和保护Python脚本的工具。它能够在运行时刻保护Python脚本的二进制代码不被泄露。因为代码是python3代码，windows上的默认python是2.7版本。所以换到ubuntu上进行操作。ubuntu上：sudoapt-getinstallpython
基于昇腾910B部署Qwen3-embedding-8B模型（通过vllm 推理引擎部署）萌新--加油 embedding 人工智能经验分享
目前基于知识库搭建，会涉及到embedding和rerank模型，目前阿里通义千问Qwen3-embedding-8B模型在网上测评效果还不错，本文基于vllm部署Qwen3-embedding-8B模型，使用的国产化算力910B2-64G单卡资源。1、环境要求：软件支持版本CANN>=8.1.RC1torch-npu>=2.5.1torch>=2.5.1Python>=3.9,<3.122、to
【SNN脉冲神经网络2】AdEx神经网络软件仿真 XvnNing SNN脉冲神经网络神经网络人工智能深度学习
本文使用AdEx神经元搭建一个完整的神经网络来进行生物神经脉冲现象的仿真。主要的目的是为了验证数学原理，因此只调用的numpy函数包。对应的代码例程如下：1.导入所需的Python函数库importnumpyasnpimportmatplotlib.pyplotaspltimportreimportos2.定义均值函数以及一些常用函数defbin_data(data):try:returnnp.m
Pyarmor 项目使用教程
Pyarmor项目使用教程pyarmorAtoolusedtoobfuscatepythonscripts,bindobfuscatedscriptstofixedmachineorexpireobfuscatedscripts.项目地址:https://gitcode.com/gh_mirrors/py/pyarmor1.项目目录结构及介绍Pyarmor项目的目录结构如下：pyarmor/├──
Python 之指针（Pointers）的理解与应用ぃ曦晔° python java 前端
Python之指针（Pointers）的理解与应用1.变量与对象的引用关系2.可变对象与不可变对象3.模拟指针操作4.函数参数传递机制5.“空指针”“双指针”的详解和应用场景6.垃圾回收与引用计数7.应用场景在Python中，虽然没有显式的指针概念（如C/C++中的int*p），但所有变量本质上都是对对象的引用（类似于指针的抽象）。理解这一点对掌握Python的内存管理、参数传递和可变/不可变对象
Python数据结构之 Big O ぃ曦晔° 数据结构算法 Big O 复杂度
学习课程：【Udemy高分付费课程】Python数据结构与算法-终极Python编码面试和计算机科学训练营在Python中，BigO表示法用于描述算法的时间复杂度，即算法运行时间与输入大小之间的关系；或空间复杂度，即算法运行时所占用的内存。在处理时间复杂度和空间复杂度是有3个希腊字母：Ω--最佳速度θ--平均速度O--最坏情况我们在讨论BigO时，总是在谈论最坏情况（WorstCase）Pytho
Python 数据结构之队列（Queue）
Python中的队列（Queue）概述队列是一种遵循先进先出（FIFO,FirstInFirstOut）原则的线性数据结构，这意味着最早进入队列的元素将最先被移除。常用于任务调度、缓冲区管理等场景。Python提供了多种实现队列的方式，包括内置模块和第三方库。Python中queue的主要类型Python的queue模块提供了几种常用的队列类型，每种类型都有其独特的特性和应用场景。1.QueueQ
Python class：定义类 Itmastergo python 开发语言
类仅仅充当图纸的作用，本身并不能直接拿来用，而只有根据图纸造出的实际物品（对象）才能直接使用。因此，Python程序中类的使用顺序是这样的：1、创建（定义）类，也就是制作图纸的过程；2、创建类的实例对象（根据图纸造出实际的物品），通过实例对象实现特定的功能。这里先教大家如何创建（定义）一个类，如何使用定义好的类将放到以后进行讲解。Python类的定义Python中定义一个类使用class关键字实现
Python之 Class的定义和使用ぃ曦晔° python 开发语言
类的定义在Python中，class是用来定义类的关键字。通过class关键字可以创建一个新的类，该类可以包含属性和方法。类名通常使用大写字母开头的驼峰命名法。定义类的基本语法：class类名:#类名惯用驼峰式命名#类属性（所有实例共享）类属性=值#构造方法（初始化对象）def__init__(self,参数1,参数2,...):#实例属性（每个实例独有）self.属性1=参数1self.属性2=
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

用深度学习解决旅行推销员问题，研究者走到哪一步了？

你可能感兴趣的:(算法,神经网络,大数据,编程语言,python)