striving长亮

MOCO论文精读-基于深度强化学习的组合优化问题研究进展(李凯文, 2020)

基于深度强化学习的组合优化研究进展

本人研究方向(博士期间)：多目标组合优化与决策研究——致力于多约束多目标多任务组合优化算法和多目标决策系统的研究与开发，以及多目标优化技术在一些工程实践中的应用。

论文：李凯文, 张涛, 王锐, 覃伟健, 贺惠晖, 黄鸿. 基于深度强化学习的组合优化研究进展. 自动化学报, 2020, 41(x):1−17

名词解释：

多目标组合优化：Multi-Objective Combinatorial Optimization (MOCO)
组合优化问题：Combinatorial Optimization Problem (COP)

摘要

组合优化问题广泛存在于国防、交通、工业、生活等各个领域, 几十年来, 传统运筹优化方法是解决组合优化问题的主要手段, 但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高, 传统运筹优化算法面临着很大的计算压力, 很难实现组合优化问题的在线求解. 近年来随着深度学习技术的迅猛发展, 深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力. 鉴于此, 近年来涌现出了多个利用深度强化学习方法解决组合优化问题的新方法, 具有求解速度快、模型泛化能力强的优势, 为组合优化问题的求解提供了一种全新的思路. 因此本文总结回顾近些年利用深度强化学习方法解决组合优化问题的相关理论方法与应用研究, 对其基本原理、相关方法、应用研究进行总结和综述, 并指出未来该方向亟待解决的若干问题.

文章目录

基于深度强化学习的组合优化研究进展
- 名词解释：
- 摘要
前言
1. 什么是COP
- 典型的组合优化问题
2. 端到端(end-to-end)方法
- 最早的尝试: Hopfield网络
- 突破性进展: Seq2Seq & GNN
3. COP研究现状
- 目前研究方向
- Pointer Network 求解组合优化问题
- - Ptr-Net模型构建
  - Ptr-Net与RL的结合
- GNN求解组合优化问题
- - 核心思想
  - GNN模型构建
  - GNN与RL的结合
  - 基于图神经网络的端到端方法
- GNN与Ptr-Net的结合
- 其他方法模型
- 深度强化学习改进的局部搜索方法
4. 基于深度学习的多目标组合优化(MOCO)方法
- DRL-MOA[4]
- MOCO研究现状
5. COP目前主要应用领域
总结与展望
参考文献

前言

组合（最）优化问题是最优化问题的一类。最优化问题似乎自然地分成两类：

一类是连续变量的问题。在连续变量的问题里，一般地是求一组实数，或者一个函数；
一类是离散变量的问题。具有离散变量的问题，我们称它为组合的。在组合问题里，是从一个无限集或者可数无限集里寻找一个对象——典型地是一个整数，一个集合，一个排列，或者一个图。

一般地，这两类问题有相当不同的特色，并且求解它们的方法也是很不同的。

CO算法是一类在离散状态下求极值的问题。把某种离散对象按某个确定的约束条件进行安排，当已知合乎这种约束条件的特定安排存在时，寻求这种特定安排在某个优化准则下的极大解或极小解的间题。组合最优化的理论基础含线性规划、非线性规划、整数规划、动态规划、拟阵论和网络分析等。组合最优化技术提供了一个快速寻求极大解或极小解的方法。

1. 什么是COP

组合最优化的特点是可行解集合为有限点集。

只要将有限个点逐一比较目标值的大小，该问题最优解就一定可以得到。但是枚举是以时间为代价的，有的枚举时间还可以接受，有的则不能接受。设问题的规模为n，如果存在一个多项式p(n)，使得算法最多执行p(n)个基本步骤便可得到解答，则这种算法称为多项式时间算法，如最短路径问题、最小支撑问题。数学模型如下所示:
$\begin{aligned} &\min F(x) \\ &\text { s.t. } G(x) \geq 0 \\ &x \in D \end{aligned}$
其中 $x$ 为决策变量、 $F (x)$ 为目标函数、 $G (x)$ 为约束条件, $D$ 表示离散的决策空间, 为有限个点组成的集合.

随着实践的发展，可行解数量随问题规模呈指数型增长，出现了越来越多的组合优化问题都很难找到求最优解的多项式时间算法。例如，最大团问题，TSP问题，点覆盖问题，3-SAP问题等等都属于这一类问题。这一类组合优化问题归为所谓的NP-hard问题。

因为一些组合优化问题还没有找到求最优解的多项式时间算法，而这些组合优化问题又有非常强的实际应用背景，人们不得不尝试着为这些问题设计优化方案：

精确算法(Exact approaches) : 求解得到问题全局最优解的一类算法, 主要包括分支定界法(Branch and Bound)和动态规划法(Dynamic Programming),其均采用分而治之的思想通过将原问题分解为子问题的方式进行求解, 通过不断迭代求解得到问题的全局最优解。缺点：虽然可以得到全局最优解，但当问题规模扩大时, 该类算法将消耗巨大的计算量, 很难拓展到大规模问题;
近似算法(Approximate Algorithm)：寻找能在较短时间（多项式时间）内得到接近予最优解的算法。如贪心算法、局部搜索算法、线性规划和松弛算法、序列算法等
启发式算法(Heuristic Algorithm)：一般情况下也能够保证计算结果同最优结果差别不超过某一常数α，但是相对于近似算法要大。也有一些启发式算法无法保证解的近似度，但计算结果通常都比较理想，由于是自己设定规则，精度较高、接近理论最优，但是泛化能力差、求解效率低，比如遗传算法、蚁群优化算法、禁忌搜索算法、麻雀搜索算法等。
缺点：很难拓展到在线、实时优化问题. 此外, 一旦问题发生变化, 上述方法一般需要重新进行搜索求解,或者通过不断试错对启发式规则进行调整以获得更好的效果, 计算成本高.

典型的组合优化问题

旅行商问题（Traveling Salesman Problem, TSP）
车辆路径问题(Vehicle Routing Problem, VRP)
加工调度问题（Scheduling Problem，如Flow-Shop Scheduling，Job-Shop Scheduling）
0-1背包问题（Knapsack Problem）
装箱问题（Bin Packing Problem, BPP）
最小顶点覆盖问题(Minimum Vertex Cover, MVC)
最小支配集问题(Minimum Dominating Problem, MDP)
图着色问题（Graph Coloring Problem）；
聚类问题（Clustering Problem）
…

2. 端到端(end-to-end)方法

最早的尝试: Hopfield网络

Hopfield 网络（Hopfield, 1985）：最早在COP的应用，用于求解TSP以及其他组合优化问题。但是每次只能学习并解决单个小规模TSP 问题实例, 对于新给定的一个TSP 问题需要从头开始再次训练,相比较传统算法并没有多大的提升。

突破性进展: Seq2Seq & GNN

Seq2Seq：将组合优化问题类比为机器翻译过程(即序列到序列的映射)(Vinyals et al., 2015)：

输入是问题的特征序列(如城市的坐标序列)
输出是解序列(如城市的访问顺序)
对机器翻译领域的经典序列映射模型(Sequence-to-Sequence, Seq2Seq) 进行了改进, 提出了可以求解组合优化问题的指针网络模型(Pointer Network, Ptr-Net)[2]
缺点：由于监督式学习需要构造大量带标签的样本, 很难实际应用, 目前大多数研究均利用深度强化学习方法对模型进行训练.

GNN：采用图神经网络对每个节点的特征进行学习, 从而根据学习到的节点特征进行后续的链路预测、节点预测等任务.

比如利用图神经网络对各个”待选节点”的Q 值进行估计, 每次根据Q 值利用贪婪策略向当前解插入一个新节点, 直到构造一个完整的解。
图神经网络和指针网络进行组合优化算法的设计,即首先使用图神经网络进行节点特征计算, 再使用指针网络的Attention 机制进行解的构造, 在TSP等问题上取得了较好的优化性能.

以上方法均为端到端(end-to-end)方法：即给定问题实例作为输入, 利用训练好的深度神经网络直接输出问题的解, 其中神经网络的参数一般利用深度强化学习方法训练得到。无需搜索，直接给出问题解，求解速度快，泛化能力强(模型一旦训练完成, 可以对具有相同分布特性的所有问题实例进行求解, 而不需要重新进行训练)，但是相比较启发式算法，端到端方法的解的最优性难以得到保证，在小规模问题上可以得到接近最优解，但是在大规模问题上，与专业的组合优化求解器还存在较大差距。

3. COP研究现状

契机：组合优化即在离散决策空间内进行决策变量的最优选择, 与强化学习的 “动作选择”具有天然相似的特征, 且深度强化学习 “离线训练、在线决策”的特性使得组合优化问题的在线实时求解成为了可能。
优势：基于DRL 的组合优化算法具有求解速度快、泛化能力强等一系列优势

目前研究方向

目前基于DRL 的组合优化方法主要分为基于DRL 的端到端算法和基于DRL 的局部搜索改进算法两大类, 其中端到端算法主要包括基于Pointer Network 的端到端方法和基于图神经网络的端到端方法两类。

利用DRL 方法改进传统的精确/近似方法, 如利用机器学习模型对经典的精确求解算法:分支定界法(Branch and bound) 的node selection和variable selection 策略进行选择
基于深度强化学习对迭代搜索类算法进行改进,局部搜索/邻域搜索是求解组合优化问题的常用近似方法,通过神经网络模型代替手工设计的启发式规则。缺点：本质上仍然是迭代型搜索算法,求解速度仍然远不及端到端方法

Pointer Network 求解组合优化问题

Ptr-Net模型构建

Pointer Network 方法可概括为利用神经网络模型实现序列到序列的映射, 其核心思想是利用编码器(Encoder) 对组合优化问题的输入序列进行编码得到特征向量, 再利用解码器(Decoder) 结合Attention 计算方法以自回归(Autoregressive) 的方式逐步构造解, 自回归即每次选择一个节点, 并在已选择节点的基础上选择下一个节点, 直到构造得到完整解.

Attention机制在这里不多介绍，有需要的可以查看我之前的一篇博客：细讲：Attention模型的机制原理

以TSP问题为例，经典指针网络模型的编码器和解码器均为LSTM(Long Short-Term Memory) 循环神经网络. 利用指针网络模型构造TSP 解的过程如下:

Attention机制根据 $d_{0}$ 和编码器得到的各城市的隐层状态计算选择各个城市的概率,选择概率最大的节点作为第一步选择的城市,以此类推，LSTM读入上一步LSTM 的隐层输出和上一步选择城市的特征向量，输出当前隐层状态 $d_{t}$ ，根据 $d_{t}$ 和各城市的 $e$ 计算选择各个城市的概率，也就是Attention机制：
$\begin{aligned} u_{j}^{t}=& \mathbf{v}^{T} \tanh \left(\mathbf{W}_{1} \mathbf{e}_{j}+\mathbf{W}_{2} \mathbf{d}_{t}\right), j \in(1, \cdots, n) \\ & P\left(\rho_{t+1} \mid \rho_{1}, \cdots, \rho_{t}, X_{t}\right)=\operatorname{softmax}\left(\mathbf{u}^{t}\right) \end{aligned}$

该深度神经网络模型的输入是城市的坐标序列, 输出是城市的顺序, 通过对该模型参数的训练可以实现问题序列到解序列的准确映射.

Ptr-Net与RL的结合

对于Pointer Network 深度神经网络模型, 可以通过监督式训练算法或者强化学习算法进行训练, 由于监督式学习方法需要提供大量最优路径的标签数据集, 实际应用较为困难, 因此目前研究中通常以强化学习算法对模型的W和v等参数进行训练

状态为城市的坐标 $s$ 以及已经访问过的城市, 动作为第 $t$ 步选择的城市 $\pi_{t}$ , 所有动作组成的城市访问顺序 $\pi$ 即为组合优化问题的解, 反馈r是路径总距离的负数, 即最小化路径长度, 总反馈即为路径总长度的负数 $-L(\pi)$ .策略即为状态 $s$ 到动作 $\pi$ 的映射, 策略通常为随机策略。

随机策略建模为:
$p_{\theta}(\pi \mid s)=\prod_{n}^{t=1} p_{\theta}\left(\pi_{t} \mid s, \pi_{1: t-1}\right)$

基于以下公式对策略 $\theta$ 进行更新:

$\begin{aligned} &\nabla \mathcal{L}(\theta \mid s)= \mathbb{E}_{p_{\theta}(\pi \mid s)}\left[(L(\pi)-b(s)) \nabla \log p_{\theta}(\pi \mid s)\right] \\ &\theta \leftarrow \theta+\nabla \mathcal{L}(\theta \mid s) \end{aligned}$

REINFORCE 算法通过以上公式对 $\theta$ 的梯度进行计算并更新, 不断训练从而得到准确的 $p_{\theta}(\pi \mid s)$ ,即实现组合优化问题序列到解序列的准确映射.

GNN求解组合优化问题

图神经网络(Graph Neural Network, GNN)是近年来提出的能够有效处理图结构数据的新方法。

核心思想

根据每个节点的原始信息(如城市坐标) 和各个节点之间的关系(如城市之间的距离), 利用图神经网络方法计算得到各个节点的特征向量, 根据各个节点的特征向量进行节点预测、边预测等任务.

GNN模型构建

一般将图定义为 $G = (V, E)$ , $V$ 代表节点的集合, $E$ 为边的集合. 图神经网络通过不断学习节点的特征、邻居节点的特征、边的特征, 并将其以各种方法进行聚合, 从而最终得到各个节点的特征向量,根据各个节点的特征向量完成预测、分类等任务.以经典GNN[3]为例, 各个节点的表征以如下公式更新:
$\mathbf{h}_{v}^{(t)}=\sum_{u \in N(v)} f\left(\mathbf{x}_{v}, \mathbf{x}_{(v, u)}^{\mathrm{e}}, \mathbf{x}_{u}, \mathbf{h}_{u}^{(t-1)}\right)$

其中:
$h_{v}^{(t)}$ 代表节点 $v$ 的表征向量,
$N (v)$ 代表v 的邻居节点的集合,
$x_{v}$ 是节点 $v$ 的特征,
${x}_{(v, u)}^{e}$ 是与 $v$ 相连的边的特征,
$x_{u}$ 是邻居节点 $u$ 的特征,
$h_{v}^{(t-1)}$ 是邻居节点 $u$ 在上一步更新的特征向量.
因此该公式根据节点 $v$ 本身的特征、边的特征以及邻居节点的特征对节点 $v$ 的表征向量进行更新,
从 $t = 0$ 开始对不断对 $h_{v}^{(t)}$ 进行更新直到收敛, 从而得到节点 $v$ 的准确特征向量.

根据各个节点的特征向量, 可以进行组合优化问题的求解:

如针对节点选择问题(如最小顶点覆盖问题), 可以将图神经网络得到的节点特征向量 $h_{v}^{(t)}$ 以一个全连接层神经网络映射到节点选择概率,从而根据概率进行节点的选择
针对边选择问题(如TSP 问题), 可以以两个节点的特征向量作为输入, 以一个全连接层神经网络映射得到一个选择概率, 即该两点之间存在边的概率, 从而进行边选择
值得注意的是, 按照概率进边的选择并不一定可以构成一个完整的哈密顿回路, 因此需要辅以搜索方法进行解的构造.

GNN与RL的结合

首先利用GNN 计算得到各个节点的表征 $h_{v}^{(t)}$ , 将各个节点的 $h_{v}^{(t)}$ 向量进一步运算得到各个节点的 $Q$ 值. 根据 $Q$ 值以迭代的方式构造解, 即每次选择 $Q$ 值最大的节点添加到当前解当中, 直到构造得到完整解,通常以DQN 强化学习方法对该图神经网络进行训练, 从而得到准确的Q 值估计.

基于图神经网络的端到端方法

模型架构：结合图神经网络、DQN 以及贪婪策略进行解的构造

对选择各个节点的概率进行估计:
- 采用structure2vec图神经网络对当前解的图结构进行建模,并根据图神经网络计算剩余可选节点中各个节点的Q 值, 随后基于贪婪策略根据Q 值选择一个新的节点添加到当前解中, 直至得到完整解。采用了深度Q 学习(Deep Q-Learning, DQN) 算法对该图神经网络的参数进行训练, 以使模型输出准确的Q 值估计.
- 采用图卷积神经网络(Graph Convolutional Networks,GCN) 对图结构进行建模
利用图神经网络对选择各个”边”的概率进行估计:
- 利用图神经网络模型(e.g., GNN,GCN)输出一个邻接矩阵, $d_{ij}$ 代表两点之间存在边的概率, $d_{ij}$ 值大则节点 $i$ 和 $j$ 大概率相连. 随后根据各个边出现概率的估计值, 使用波束搜索(beam search) 的方式构造最终的可行解
- 采用监督式方法进行训练, 即利用LKH3 或Concorde求解器构造大量 “坐标-最优路径”的训练数据, 根据最优解的真实邻接矩阵和图神经网络输出的邻接矩阵计算交叉熵, 以交叉熵为损失函数训练模型

GNN与Ptr-Net的结合

指针网络模型主要用于求解TSP、VRP 等具有序列特性的组合优化问题(即该类问题的解与节点的顺序有关),由于指针网络利用Attention 机制以自回归的方式对解进行构造, 因此适用于求解序列组合优化问题，以自回归的方式逐步选择节点.
基于图神经网络的方法由于得到的是节点的特征向量, 自然地可以计算得到节点选择的概率, 因此在MVC、MIS 等顺序无关的点选择问题上多有应用，根据节点的特征向量计算边选择的概率, 然后利用波束搜索等方法构造解。

结合：用图神经网络计算得到的节点特征向量 $h_{v}^{(t)}$ ,代替指针网络LSTM 编码器计算得到的各节点的隐层输出向量 $e_{t}$ , 仍然采用Attention机制计算每一步的节点选择概率, 以自回归的方式逐步构造得到完整解。

有研究者结合指针网络和图神经网络设计了一种图指针网络(Graph Pointer Network,GPN) 用来求解大规模TSP 问题以及带时间窗约束的TSP 问题。该模型的编码器包含两部分: Point Encoder 以及Graph Encoder:

Point Encoder对城市坐标进行线性映射, 并输入到LSTM中得到每个城市的点嵌入,
Graph Encoder 通过GNN 图神经网络对所有城市进行编码, 得到每个城市的图嵌入.
模型根据图嵌入和点嵌入, 基于Attention机制计算每一步城市选择的概率, 并引入Vector context 提高模型的泛化能力. 文章采用分层强化学习方法(Hierarchical RL, HRL) 对模型进行训练.
该方法在100 规模的TSP 问题上效果一般，但在大规模TSP 上存在优势, 未来如何将指针网络的Attention 机制和图神经网络相结合是一个重要的研究点.

其他方法模型

相对于传统的Seq2Seq 模型, 近年来Transformer模型在自然语言处理领域取得了巨大的成功, Transformer 的Multi-head Attention 机制可以使模型更好的提取问题的深层特征, 鉴于此,多个最新的研究借鉴了Transformer 模型进行了组合优化问题求解的研究：

法1：结合局部搜索可以提高性能, 但是其神经网络模型本身与传统的Pointer Network 模型相比并没有显著的优势,具体如下：
改进传统的指针网络模型, 其编码层采用了与Transformer模型编码层相同的结构, 即利用Multi-head Attention 方法计算得到节点的特征向量; 其解码层没有采用LSTM, 而是将最近三步的决策进行线性映射得到参考向量, 从而降低模型复杂度, 其Attention计算方式与传统Pointer Network 模型相同, 仍然采用经典的REINFORCE 方法对该模型进行训练,
法2：经过改进, 该方法的优化性能超越了之前所有的端到端模型
编码层采用了和Transformer模型相同的Multi-head Attention 机制, 但解码层和Attention 机制存在很大不同, 首先该模型每一步的解码过程中考虑的是第一步所做的决策和最近两步的决策,采用了Transformer 模型的Self-Attention 计算方法, 增加了更多计算层以提高模型的表现，并设计了一种rollout baseline 来代替Critic神经网络:即在之前训练过程中得到的所有策略模型里, 选择在测试集中表现最好的模型作为基线策略, 并采用贪婪方式进行动作选择, 将利用该基线策略对状态s 求解得到的目标函数值作为 $b (s)$ ,如果当前策略比历史最优策略的表现好, 则进行正向激励, 从而对当前策略进行评价和参数更新.

下图是截止到2020年本论文发表时的主要算法模型和针对求解问题比较：

深度强化学习改进的局部搜索方法

虽然端到端方法可以通过深度神经网络模型直接输出问题的解, 实现组合优化的快速求解, 但是其优化效果与LKH3、Google OR tools 等专业求解器相比仍有一定差距.

局部搜索(local search) 是求解组合优化问题的经典方法, 当前的局部搜索算法主要是通过人工对搜索的启发式规则进行设计, 以获得更好的优化效果, 鉴于近年来深度强化学习在在各领域取得的瞩目的学习能力, 学者们开始研究利用深度强化学习方法来自动学习局部搜索算法的启发式规则, 从而比人工设计的搜索规则具有更好的搜索能力.

深度强化学习改进的局部搜索方法是自2019 年以来最新提出的一类组合优化方法, 主要用于求解VRP 等路径优化问题

基于深度强化学习的组合优化问题搜索模型NeuRewriter（Chen, 2019）：
- 和局部搜索具有相似的算法流程, 即首先随机构造一个可行解, 在该初始解的基础上通过局部搜索不断提高解的质量
- 利用深度强化学习方法对局部搜索的策略进行训练, 利用学习到的策略对搜索过程进行引导. 其策略由两部分构成（Region-Picker 和Rule-Picker）：以作业车间调度问题为例,首先利用Region-Picker 选定一个工序, 其次利用Rule-Picker 对该工序的操作策略进行决策, 如与另一个工序进行调换
- 利用Actor-Critic 方法对Region-Picker 和Rule-Picker 策略进行了训练
也有研究者采用深度强化学习改进的局部搜索方法对适定性问题(Satisfiability) 进行了研究,仍然采用局部搜索的求解框架, 利用深度强化学习对局部搜索中变量选择算子进行学习。
基于大规模邻域搜索框架对组合优化问题进行求解——Gao L, Chen M, Chen Q, Luo G, Zhu N, Liu Z. Learn to design the heuristics for vehicle routing problem. arXiv preprint arXiv:200208539, 2020.
Learn to Improve(LSI) 组合优化问题求解方法——Lu H, Zhang X, Yang S. A Learning-based Iterative Method for Solving Vehicle Routing Problems. In: International Conference on Learning Representations, 2019.

针对深度强化学习改进的局部搜索方法, 目前的研究仍然处于起步阶段, 但已经取得了超越传统组合优化求解器的成果, 如何提高解搜索的效率以及扩大启发式算子的搜索空间是未来提升算法性能的重要研究方向.

4. 基于深度学习的多目标组合优化(MOCO)方法

研究的主体是多目标强化学习算法, 而不是如何利用强化学习方法解决传统的多目标优化问题.

DRL-MOA[4]

该方法借鉴Pointer Network 模型采用端到端的求解框架, 采用基于分解的思想将多目标问题分解为多个子问题, 并将每个子问题建模为Pointer Network模型, 多个子模型利用基于邻居的参数迁移的方法进行协同训练.

利用随机生成的40 城市TSP 问题进行模型训练, 一旦模型训练好, 可以求解任意生成的100、200、500 城市的TSP 问题, 而不用重新训练模型, 具有较强的泛化能力

得益于端到端的求解框架, 求解速度快以及泛化能力强是该方法的优势, 且该方法的思想很容易迁移到其他多目标优化问题的求解中.

不足：文章仅对多目标TSP 问题进行了实验研究, 对其他多目标组合优化问题以及更为普遍的多目标连续优化问题没有进行研究, 并且由于该类方法神经网络模型个数与权重个数成正比, 如何提高该类方法的训练效率也是未来的研究方向.

MOCO研究现状

深度强化学习改进的局部搜索方法是近年来兴起的另外一类方法, 其本质上仍然是启发式搜索算法, 但是没有采用人工设计的搜索规则, 而是利用深度强化学习算法对搜索规则进行学习, 因此该方法具有较强的优化能力, 其优化效果可以超越传统的优化算法, 但是其求解时间仍然远慢于端到端模型, 因此决策者需要根据优化效果和求解速度之间的权衡来选择不同的方法.

强化学习训练方法收敛比监督式训练方法慢, 但强化学习得到的模型具有更强的泛化能力.

对于路径优化问题, 节点选择的顺序对结果有很大影响,因此基于Attention 机制的方法在此类问题上有较好的效果. 并且对于复杂的路径选择问题, 如CVRP问题, 目前的研究均采用Attention 机制, 而没有单纯采用图神经网络的方法, 可见Attention 机制在处理具有序列特性的组合优化问题上具有较好的性能;
对于解决MVC、MAXCUT等问题, 即点选择问题, 该类问题对节点的顺序没有要求, 此种情况下图神经网络在该类问题上应用较多;
同时, 结合图神经网络和Attention 机制的方法在TSP 等路径优化问题上也取得了较好的效果

由图中可以看出：
近年来图神经网络结合各种搜索方法(波束搜索、树搜索) 在各种组合优化问题上得到了广泛的应用, 其主要应用于没有序列特性的组合优化问题, 如MVC、MAXCUT 等. 如何高效地将图神经网络和Attention 机制相结合是未来可行的研究思路.
基于Attention机制的指针网络方法是解决具有序列决策特性组合优化问题的主要方法, 如TSP、VRP 等问题.如何改进编码器和解码器的神经网络模型结构也是提高模型性能的一个重要研究方向.

5. COP目前主要应用领域

网络与通信领域
由于网络与通信领域存在多种典型的组合优化问题, 如资源分配、路由拓扑优化、计算迁移等, 因此基于深度强化学习的组合优化在网络与通信领域存在较多的应用.
交通领域
在货物配送领域, 随着电商规模的不断扩大,如何做到城际交通规划系统的在线实时响应是一个重点研究问题.
高性能计算领域
人工智能模型的训练是一个耗时极长的任务,合理地对计算资源进行规划和调度能够有效提高计算效率
微电网能量管理领域
在微电网能量管理问题中, 用电、储能等设备的启停控制是典型的离散优化问题

总结与展望

实际生产生活中存在很多组合优化问题, 已有大量研究对各种组合优化方法进行了研究, 但是面对大规模复杂组合优化难题时, 现有方法很难在可接受时间内找到满意解, 难以满足很多问题在线优化的需求. 而近年来基于深度强化学习的组合优化方法在多种组合优化问题上展示出了良好性能, 具有较强的泛化性能和快速的求解速度, 为组合优化问题的在线求解提供了新的思路。

当前的研究尚属于起步阶段, 仍然存在一系列问题.要构建基于DRL 解决组合优化问题的理论方法体系, 还需从如下几个方面开展研究：

在模型方面. 在当前的研究中, 直接采用深度神经网络模型输出的解通常较差,当前的模型仍然有很大的提升空间,未来需要进一步对求解组合优化问题的深度神经网络模型进行研究, 如何有效结合图神经网络和Attention 机制是一个较好的研究点。
在研究对象方面. 当前文献研究的问题都相对简单, 而实际中的组合优化问题通常具有多目标、多约束、非静态等复杂特性,当前方法很难对该类问题进行求解, 目前考虑多目标优化、约束优化的文章较少。未来基于深度强化学习方法对多目标、约束优化、动态优化问题进行研究是一个重要的研究方向.
在深度强化学习训练算法方面. 目前对端到端模型的训练大多采用REINFORCE、DQN 等传统训练算法, 具有采样效率低、收敛慢等缺陷, 如何根据组合优化问题的特性设计更加高效的强化学习训练算法也是一个未来需要着重研究的内容.
如何利用基于深度强化学习的组合优化方法来解决工程实际中的在线调度优化问题将会成为未来重要的研究方向.

参考文献

注：由于本综述论文参考文献众多，我只列举了几个我认为比较重要的文献，如果有兴趣更加深入地研究，可以直接查看综述原文

组合优化算法-百度百科
Vinyals O, Fortunato M, Jaitly N. Pointer networks. In: Advances in Neural Information Processing Systems, 2015.
Scarselli F, Gori M, Tsoi AC, Hagenbuchner M, Monfardini G.The graph neural network model. IEEE Transactions on Neural Networks, 2008, 20(1): 61−80
Li K, Zhang T, Wang R. Deep Reinforcement Learning for Multiobjective Optimization. IEEE Transactions on Cybernetics,2020.

你可能感兴趣的:(多目标优化与决策,人工智能,算法,深度学习,哈密顿路径)

嵌入式linux下基于boa cgic sqlite3的ajax web服务器搭建モザイクカケラ嵌入式linux-web 嵌入式系统开发 boa cgic sqlite3 嵌入式linux ajax
先上大家的资源全部亲测可用sqlite3数据库c语言常用接口应用实例sqlite3数据库交叉编译并移植到嵌入式开发环境步骤fprintf与stderr、stdout的使用Windows中IIS服务器被防火墙阻止导致外网无法访问sqlite3.OperationalError:unabletoopendatabasefileSQLiteDelete语句SQLite数据库中rowid使用基本操作交叉编
VSCode更改程序编译之后生成文件的保存路径一low永逸安装IDE vscode
目录目标过程如何生成json代码其他参考目标想把程序文件和生成文件分开来，生成在当前文件的out文件夹过程在保存代码的文件夹下面再建一个保存生成文件的文件夹，我生成了out文件夹打开.vscode文件夹下面settings.json文件（这个json文件可以自己生成或复制过来，不影响使用）在settings.json中加入以下代码，我主要使用C++语言，所以只改这个，不同系统的shell语法不一样
5、旋转与自适应布局：iOS应用开发的关键 c7d8e9 8 SDK入门 iOS开发自适应布局旋转处理
旋转与自适应布局：iOS应用开发的关键1.旋转和自适应布局的重要性iPhone和iPad是令人惊叹的工程杰作。苹果的工程师们找到了各种方法，将最大功能压缩进一个小巧的包装里。其中一个例子就是这些设备可以以纵向（高而窄）或横向（短而宽）模式使用，而且这种方向可以在运行时通过简单旋转设备来改变。你可以在iOS的网页浏览器MobileSafari中看到这种被称为自动旋转的行为示例。像许多iOS应用程序一
实体，dto，vo三种pojo的区别和联系不爱吃大饼 java
在软件开发，特别是Java应用程序中，实体（Entity）、数据传输对象（DTO，DataTransferObject）和视图对象（VO，ViewObject）是三种常见的对象类型。它们各自有不同的责任和用途。下面是对它们的定义、区别和联系的详细解释。1.实体（Entity）定义：实体是与数据库表直接对应的对象，通常用于持久化层。它映射到数据库中的一行记录，每个实体对象的属性对应数据库表中的字段。
DTO、VO、POJO与实体类使用方案（结合Mapper.xml） csdn_HPL xml windows
结合MyBatis的Mapper.xml文件，展示完整的层级数据流转和数据库操作。1.实体类优化（Entity）//User.java@Data@NoArgsConstructor@AllArgsConstructor@TableName("sys_user")publicclassUser{@TableId(type=IdType.AUTO)privateLonguserId;@NotBlank
Xcode26新特性与iOS26适配指南 BianHuanShiZhe ios mac
Xcode26新特性在WWDC25上Apple推出了Xcode26，相比较Xcode16，它有如下的变化。项目安装包更小，其他组件与工具链只有在需要时才会下载。设置界面重新设计，菜单从顶部挪到了左侧，其中Accounts改名为AppleAccounts，TextEditing改名为Editing，KeyBindings改名为Shortcuts，同时增加了菜单Notifications。模拟器运行时
浅谈qt界面开发 xzdjsnb qt 开发语言
一，首先理解什么mainwindow与widget区别。下面根据百度大家自己看看`QMainWindow`和`QWidget`是Qt中常用的两个类，它们之间有一些重要的区别和关系：1.**区别**：-**QMainWindow**：-`QMainWindow`是用于创建应用程序主窗口的类，通常包含菜单栏、工具栏、状态栏和中央部件。-用于创建具有多个子窗口或文档视图的应用程序，负责应用程序的整体框架
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
操作系统基本概念与进程管理：从入门到精通阿贾克斯的黎明软考软考
目录操作系统基本概念与进程管理：从入门到精通一、常见操作系统与计算机系统层次结构二、操作系统的概念、功能与特征三、操作系统的发展与分类四、进程管理（一）进程的状态与状态转换（二）前驱图（三）进程同步与互斥机制（四）信号量机制与PV操作（五）PV操作实现前驱关系（六）死锁（七）银行家算法在计算机的世界里，操作系统就像是一位幕后的“大管家”，默默管理着计算机的各种资源，协调着各种程序的运行。今天，咱们
鸿蒙线程池全揭秘：让你的应用快、稳、省资源 harmonyos
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
【HarmonyOS next】ArkUI-X休闲益智记忆翻牌【进阶】 harmonyos-next
本文通过记忆翻牌游戏实现，揭秘网络图片在HarmonyOS与iOS设备上的渲染差异，并提供专业级优化方案。基于ArkUI-X的Web组件技术，我们实现了一套代码双端运行的混合架构。一、跨平台实现架构//ArkTS核心实现importweb_webviewfrom'@ohos.web.webview';@Entry@ComponentstructIndex{controller:web_webvie
【HarmonyOS Next】ArkUI-X休闲益智接水果【进阶】 harmonyos-next
本文通过ArkUI-X实现跨平台接水果游戏，深入探究网络图片在HarmonyOS与iOS设备上的渲染差异，并提供专业级优化方案。基于WebView的混合架构，我们实现了单代码库双端适配的高效开发模式。一、跨平台架构设计//ArkTS核心实现importweb_webviewfrom'@ohos.web.webview';@Entry@ComponentstructIndex{controller:
鸿蒙关系型数据库实战：高效数据存储与管理数据库harmonyos
在鸿蒙应用开发中，关系型数据库（RDB）是结构化数据存储的核心方案。通过深度实践，其基于SQLite的轻量级实现不仅性能出色，更提供了强大的事务支持和类型安全。以下是关键经验总结：三大核心优势：SQL兼容：完整支持SQL92标准语法线程安全：内置多线程读写锁机制加密存储：支持AES-256加密敏感数据关系型数据库实战封装及使用：在Utils目录下新建一个RdbUtils文件//./src/main
数文件夹中jpg,json文件个数叶子202422 Python学习记录 json sql 数据库
#2025.6.14importosfolder_path=r"E:\shujuji\the_seconde_shujuji_select_taka_photo_in_2025_6_9\select_from_images\select_colors"#替换为你的文件夹路径jpg_count=0json_count=0forfilenameinos.listdir(folder_path):iff
Markdown 叶子202422 Python学习记录 python
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Mark
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
生成树协议（STP）技术详解：原理、演进与配置实践
生成树协议（SpanningTreeProtocol，简称STP）是局域网交换网络中的“防堵大师”，旨在解决环路问题，确保数据传输稳定无阻。从经典的IEEE802.1DSTP，到思科的PVST（每VLAN生成树）、快速的RSTP（IEEE802.1w），再到高效的MSTP（IEEE802.1s），STP家族历经演进，满足了现代网络的多样化需求。一、STP概述：局域网的防环基石1.1STP的定义与背
Python开发AI智能体(三)———Langchain定义提示词模板【本人】 Agent智能体 python 人工智能 langchain 语言模型
前言上篇文章给大家介绍AI项目检测平台LangSmish以及开源框架Langchain的使用，并且带领大家编写了一个案例。这篇文章将介绍在Langchain框架中如何定义提示词模板一、什么是提示词模板？提示词模板（PromptTemplate）是大语言模型（LLM）应用开发中的核心概念，本质是预定义的提示结构框架。它通过将静态文本与动态变量结合，实现标准化、可复用的提示生成机制。它提示词可以是一个
信息系统项目管理师2025年考试关键知识点梳理-第11章项目成本管理 ℃-柠檬职场和发展其他高项项目管理
项目成本管理是为了项目在批准的预算内完成，对成本进行规划、估算、预算、融资、筹资、管理和控制的过程。项目成本管理重点关注完成项目活动所需资源的成本，但同时也考虑项目决策对项目产品、服务或成果的使用成本、维护成本和支持成本的影响。因此，项目成本管理还需使用其他过程和许多通用财务管理技术，如投资回报率分析、现金流贴现分析和投资回收期分析等。1、管理基础1.1重要性和意义项目管理主要受范围、时间、成本和
项目管理10大知识领域，49个管理过程关键知识点梳理 ℃-柠檬职场和发展其他
一、项目整合管理1、制定项目章程输入：商业文件（商业论证、效益管理计划）、协议工具技术：专家判断、头脑风暴、焦点小组、访谈输出：项目章程、假设日志2、制定项目管理计划输入：项目章程、其他工程输出工具技术：专家判断、头脑风暴、核对单、焦点小组、访谈输出：项目管理计划3、指导与管理项目工作输入：项目管理计划、项目文件、批准的变更请求工具技术：项目管理信息系统、会议输出：可交付成果、工作绩效数据、问题日
AEPR人像磨皮润肤美容插件的使用指南觉昧
本文还有配套的精品资源，点击获取简介：AEPR人像磨皮润肤美容插件是一款结合AdobeAfterEffects和Photoshop的专业图像处理工具，用于视频和图像后期制作。该插件简化了人像美容过程，提供美白、磨皮和润色功能，帮助用户获得理想的视觉美感。通过使用该插件，用户能够轻松改善肤色和皮肤质地，而高斯模糊、斑点修复和色彩平衡调整等技术则保证了皮肤质感的自然与细腻。为了实现最佳效果，用户需要遵
C++快速排序算法详解与实现小小的博客排序算法 c++算法排序算法 c++排序算法
快速排序（QuickSort）是一种高效的排序算法，由英国计算机科学家东尼·霍尔（TonyHoare）于1960年发明。本文将详细讲解快速排序算法的原理和实现，并通过C++语言展示其代码实现。1.快速排序算法原理快速排序算法的基本思想是分治法（DivideandConquer），其核心步骤如下：1.选择一个基准元素（pivot），通常选择序列中的第一个或最后一个元素。2.将序列分为两部分，一部分是
如何使用 langchain 与 openAI 连接海乐学习 langchain python langchain python
上一篇写了如何安装langchainhttps://www.cnblogs.com/hailexuexi/p/18087602这里主要说一个langchain的使用创建一个目录langchain，在这个目录下创建两个文件main.py这段python代码，用到了openAI，需要openAI及FQ。这里只做为示例#-*-coding:utf-8-*-fromlangchain.text_split
Matplotlib 库来可视化频谱泄漏和加窗的效果 Mark White matplotlib
前言很多朋友学习音频技术的时候，不理解这个频谱泄漏是什么，我们这次写个小代码直观地感受一下代码演示：频谱泄漏与加窗我们将生成一个简单的正弦波信号，然后分别用**不加窗（矩形窗）和加窗（汉明窗）**的方式对其进行傅里叶变换，并对比它们的频谱图。你会清晰地看到加窗如何减少了频谱泄漏。importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.fftimpo
DeLorean联手Sui网络推出最新区块链订车,XBIT平台xaut今日价格行情飙升引热议 caijingshiye 区块链
币界网6月24日讯,全球豪华汽车领域迎来颠覆性变革!DeLorean汽车公司今日宣布,基于SuiNetwork打造的全球首个区块链汽车预订市场正式上线,用户可通过加密货币直接预订其旗舰电动跑车Alpha5,并在等待交付期间通过质押资产赚取收益。这一创新模式不仅解决了传统汽车预订的退款难、周期长等痛点,更将区块链技术的透明性与金融属性深度融合。受此消息刺激,去中心化交易所XBIT平台上的黄金稳定币x
使用LangChain构建智能应用：从入门到实战 afTFODguAKBF langchain python
引言在当今的人工智能时代，构建智能应用程序已经成为越来越多开发者的目标。LangChain是一个强大的工具，可以帮助我们快速开发基于大型语言模型（LLM）的应用。本篇文章将带你了解如何从零开始使用LangChain，构建一个简单的LLM应用程序，并逐步探索更复杂的功能。主要内容构建简单的LLM应用使用LangChain，我们可以快速构建一个简单的LLM应用程序。接下来，我将带你一步步实现。什么是L
Spring Cloud Ribbon核心负载均衡算法详解代码的余温 spring cloud ribbon 负载均衡
Ribbon作为SpringCloud生态中的客户端负载均衡工具，提供多种动态负载均衡算法，根据后端服务状态智能分配请求。其核心算法及适用场景如下：一、Ribbon负载均衡算法算法名称工作原理引用来源轮询(RoundRobinRule)按服务列表顺序依次分发请求，实现均匀分摊负载随机(RandomRule)从可用服务列表中随机选择一个实例处理请求加权响应时间(WeightedResponseTim
端侧开发详解初赛收官盛宴 | 2025高通边缘智能创新应用大赛第九场公开课来袭！阿加犀智能人工智能智能硬件
各位开发者、技术爱好者，2025高通边缘智能创新应用大赛即将迎来初赛阶段的最后一堂重磅公开课！诚邀大家于7月3日（星期四）晚8点，准时收看由瑞莎的嵌入式开发工程师张子烽（Morgan）带来的专题分享，共同探索端侧智能应用开发的创新技术路径。聚焦前沿平台掌握端侧智能开发流程本次课程将聚焦基于瑞莎DragonQ6A开发板的端侧人工智能应用开发。该开发板搭载高通跃龙™QCS6490平台（由阿加犀提供开发
后端技术：利用 MySQL 实现数据加密大厂资深架构师 Spring Boot 开发实战 mysql 数据库 ai
后端技术：利用MySQL实现数据加密关键词：MySQL数据加密、AES加密、数据库安全、数据保护、加密算法、密钥管理、SQL注入防御摘要：本文深入探讨如何在MySQL数据库中实现数据加密，保护敏感信息免受未授权访问。我们将从加密的基本原理出发，详细讲解MySQL支持的多种加密方式，包括AES、SHA等算法的实现方法。文章包含完整的代码示例和最佳实践，帮助开发者在实际项目中应用数据加密技术，同时讨论
DAO模式红中马喽 java 数据库开发语言笔记学习后端设计模式
前言DAO（DataAccessObject）模式是一种常用的设计模式，主要用于将数据访问逻辑与业务逻辑分离。它提供了一种抽象层，使得应用程序可以与不同的数据源（如数据库、文件系统等）进行交互，而无需了解底层数据存储的细节。DAO模式的核心思想是将数据访问操作封装在独立的类中，从而提高代码的可维护性、可扩展性和可重用性。如何使用DAO模式1.首先导入这个包（有需要的可以私聊我）然后添加配置文件，为
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本