好奇小圈

深度强化学习的组合优化[1] 综述阅读笔记

文章目录

前言
零、组合优化问题基础
- 1. 定义
- - （1）定义
  - （2）常见问题
- 2. 方法
- - （1）精确方法
  - （2）近似方法
  - （3）深度学习方法
- 3. 文章架构
一、概述
- 1. 神经网络
- - （1）Hopfield 网络
  - （2）指针网络Ptr-Net
  - （3）图神经网络
- 3. 深度强化学习DRL
- - （1）端到端方法
  - （2）改进传统方法
二、原理
- 1. Pointer Network
- - （1）求解TSP问题
  - （2）Attention机制
- 2. Pointer Network+DRL
- - （1）求解TSP问题
  - （2）REINFORCE强化学习算法
- 3. 图神经网络
- - （1）图定义
  - （2）经典GNN
三、理论与方法
- 1. 基于DRL的端到端算法
- - （1）基于Pointer Network-Seq2Seq
  - （2）基于Pointer Network-Transformer
  - （3）基于图神经网络
- 2. 基于DRL的局部搜索改进算法
- 3. 基于DL的多目标组合优化算法
- 4. 总结对比
四、应用综述
- 1. 网络与通信领域
- - （1）资源分配
  - （2）拓扑与路由优化
  - （3）计算迁移
- 2. 其他领域
- - （1）交通领域
  - （2）生产制造领域
  - （3）高性能计算领域
  - （4）微电网能量管理领域
五、发展与展望
- 1. 模型方面
- 2. 研究对象方面
- 3. 深度强化学习训练算法方面
- 4. 工程实际方面
总结

前言

此文为文献阅读笔记。
[1]李凯文, 张涛, 王锐, 覃伟健, 贺惠晖, & 黄鸿. (2021). 基于深度强化学习的组合优化研究进展. 自动化学报, 47(11), 17.

零、组合优化问题基础

1. 定义

（1）定义

组合优化问题 (Combinatorial optimization problem, COP)是一类在离散状态下求极值的最优化问题。

（2）常见问题

旅行商问题(Traveling salesman problem, TSP)、
车辆路径问题 (Vehicle routing problem, VRP)、
车间作业调度问题 (Job-shop scheduling)、
背包问题 (Knapsack)、
最小顶点覆盖问题 (Minimum vertex cover, MVC)、
最小支配集题 (Minimum dominating problem, MDP) 等。

2. 方法

（1）精确方法

精确方法 (Exact approaches)采用分而治之的思想通过将原问题分解为子问题的方式进行求解，通过不断迭代求解得到问题的全局最优解。

分支定界法 (Branch and bound)
动态规划法 (Dynamic programming)

（2）近似方法

可以求解局部最优解的方法

近似算法 (Approximate algorithms)
贪心算法、局部搜索算法、线性规划和松弛算法、序列算法。
启发式算法 (Heuristic algorithms)
模拟退火算法、禁忌搜索、进化算法(如遗传算法, 差分进化算法等)、蚁群优化算法、粒子群算法、迭代局部搜索、变邻域搜索等。

（3）深度学习方法

深度神经网络 (Deep neural networks, DNN)

自动地对图像的特征进行学习

深度强化学习 (Deep reinforcement learning, DRL)

根据当前的环境状态做出动作选择, 并根据动作的反馈不断调整自身的策略, 从而达到设定的目标

3. 文章架构

第 1 节概述：对其产生、历史发展、方法分类以及优缺点进行了介绍;
第 2 节基本原理进行介绍;
第 3 节方法综述：根据方法的不同类别, 对各个算法的原理、优缺点和优化性能进行了对比介绍;
第 4 节应用研究;
第 5 节总结.

一、概述

1. 神经网络

（1）Hopfield 网络

学习并解决单个小规模TSP问题实例。

（2）指针网络Ptr-Net

监督式学习的方式训练该网络并在 TSP问题上取得了较好的优化效果，可以非迭代搜索求解。

（3）图神经网络

与指针网络模型不同的是, 该类方法采用图神经网络对每个节点的特征进行学习

3. 深度强化学习DRL

（1）端到端方法

给定问题实例作为输入, 利用训练好的深度神经网络直接输出问题的解。
求解速度快、泛化能力强，但最优性很难保证。

（2）改进传统方法

求解速度仍然远不及端到端方法。

二、原理

1. Pointer Network

利用编码器 (Encoder) 对组合优化问题的输入序列进行编码得到特征向量, 再利用解码器 (Decoder) 结合Attention 计算方法以自回归 (Autoregressive) 的方式逐步构造解

（1）求解TSP问题

以求解TSP问题为例：

输入为城市坐标，输出为城市的顺序。

（2）Attention机制

$\begin{aligned} & u_j^t=\boldsymbol{v}^{\mathrm{T}} \tanh \left(\boldsymbol{W}_1 \boldsymbol{e}_j+\boldsymbol{W}_2 \boldsymbol{d}_t\right), j \in(1, \cdots, n) \\ & P\left(\rho_{t+1} \mid \rho_1, \cdots, \rho_t, X_t\right)=\operatorname{softmax}\left(\boldsymbol{u}^t\right) \end{aligned}$
· $\boldsymbol{d}_t$ 译码器当前计算得到的隐状态
· $e$ 编码器计算得到的隐状态
· $t$ 为第t步
· $\boldsymbol{W}$ 和 $\boldsymbol{v}$ 均为神经网络的参数
· $j$ 第j个城市节点
· $u_j^t$ 代表在第 $t$ 步解码过程中选择城市 $j$ 的概率,

在每一步解码过程中, 对于每个城市 $j$ , 均可以计算得到其 $u_j^t$ 值，此时可以选择具有最大概率值的节点添加到解当中, 按照该方式不断选择城市, 直至构造得到一个完整解.

2. Pointer Network+DRL

强化学习通过试错机制不断训练得到最优策略, 首先需要将组合优化问题建模为马尔科夫过程,其核心要素为状态、动作以及反馈。

（1）求解TSP问题

以TSP问题为例：
$p_\theta(\pi \mid s)=\prod_n^{t=1} p_\theta\left(\pi_t \mid s, \pi_{1: t-1}\right)$

·状态 $s$ 为城市的坐标以及已经访问过的城市
·动作为第 $t$ 步选择的城市 $\pi_t$ , 所有动作组成的城市访问顺序 $\pi$ 即为组合优化问题的解
·反馈 $r$ 是路径总距离的负数, 即最小化路径长度
·策略即为状态 $s$ 到动作 $\pi$ 的映射, 策略通常为随机策略, 即得到的是选择城市的概率 $p_\theta(\pi \mid s)$

（2）REINFORCE强化学习算法

又名基于蒙特卡洛的策略梯度方法：不断执行动作直到结束, 在一个回合结束之后计算总反馈, 然后根据总反馈对策略的参数进行更新

以TSP问题为例，总反馈为总路径长度的负数 $-L(\pi)$
$\begin{aligned} & \nabla \mathcal{L}(\theta \mid s)= \mathrm{E}_{p_\theta(\pi \mid s)}\left[(L(\pi)-b(s)) \nabla \ln p_\theta(\pi \mid s)\right] \\ & \theta \leftarrow \theta+\nabla \mathcal{L}(\theta \mid s) \end{aligned}$

· $p_\theta(\pi \mid s)$ 为每步动作选择概率的累乘, 则 $\ln p_\theta(\pi \mid s)$ 计算为每步动作选择概率对数的求和, 以该值对参数 $\theta$ 计算偏导可得梯度值 $\nabla \ln p_\theta(\pi \mid s)$
· $(L(\pi)-b(s))$ 决定了梯度下降的方向
· $b (s)$ 代表策略的平均表现 (Baseline), 如果当前策略的表现比 “平均”好, 则对该策略进行正向激励, 反之亦然

·有多种方式对 $b (s)$ 进行估计, 运用较多的方法是新增一个 Critic 神经网络计算 $b (s)$ , 即给定一个 TSP 问题 $s$ , 利用 Critic 神经网络估计该问题解的路径长度. Critic 网络与策略网络同步进行训练, 以策略网络训练过程中产生的 $L(\pi))$ 作为训练集对 Critic 进行训练

3. 图神经网络

根据每个节点的原始信息 (如城市坐标) 和各个节点之间的关系 (如城市之间的距离), 利用图神经网络方法计算得到各个节点的特征向量, 根据各个节点的特征向量进行节点预测、边预测等任务

（1）图定义

图一般被定义为：
$G = (V, E)$
· $V$ 为节点集合
· $E$ 为边集合

不断学习节点的、邻居节点、边的特征，并进一步聚合，得到每个节点的特征向量，根据各个节点的特征向量完成预测、分类等任务

（2）经典GNN

以经典GNN为例：

$\boldsymbol{h}_v^{(t)}=\sum_{u \in N(v)} f\left(\boldsymbol{x}_v, \boldsymbol{x}_{(v, u)}^e, \boldsymbol{x}_u, \boldsymbol{h}_u^{(t-1)}\right)$

· $\boldsymbol{h}_v^{(t)}$ 代表节点 $v$ 的表征向量
· $N (v)$ 代表 $v$ 的邻居节点的集合
· $x_v$ 是节点 $v$ 的特征
· $x_{(v, u)}^e$ 是与 $v$ 相连的边的特征
· $x_u$ 是邻居节点 $u$ 的特征
· $\boldsymbol{h}_u^{(t-1)}$ 是邻居节点 $u$ 在上一步更新的特征向量

因此该公式根据节点 $v$ 本身的特征、边的特征以及邻居节点的特征对节点 $v$ 的表征向量进行更新, 从 $t = 0$ 开始对不断对 $\boldsymbol{h}_v^{(t)}$ 进行更新直到收敛, 从而得到节点 $v$ 的准确特征向量

然后可以以一个全连接层神经网络映射到一个选择概率（如计算Q值的方式）。

三、理论与方法

1. 基于DRL的端到端算法

（2）基于Pointer Network-Transformer

Transformer 的 Multi-head attention 机制可以使模型更好地提取问题的深层特征。

Deudon 等
借鉴Transformer改进指针网络；
编码层采用了与Transformer模型多头结构；
解码层将LSTM改为近三步的决策进行线性映射得到参考向量；
有效提高TSP的解质量
Kool 等
编码层采用了与Transformer模型多头结构；
解码层的解码过程中考虑的是第一步所做的决策和最近两步的决策；
Self-attention 计算方法；
文章设计了一种 Rollout baseline 来代替 Critic 神经网络；
贪婪策略；
在众多问题上，性能超越了以上所有前者，接近最优解
Ma 等
图指针网络 (Graph pointer network, GPN)；
编码器包含两部分: Point encoder 以及 Graph encoder；
Point encoder 对城市坐标进行线性映射, 并输入到 LSTM中得到每个城市的点嵌入；
Graph encoder 通过 GNN 图神经网络对所有城市进行编码, 得到每个城市的图嵌入；
引入 Vector context 提高模型的泛化能力；
章采用分层强化学习方法 (Hierarchical RL, HRL) 对模型进行训练；
在求解大规模问题上表现更加优秀，小规模上则劣于Kool的方法

（3）基于图神经网络

Dai 等
利用structure2vec图神经网络进行建模；
计算Q值并采用贪婪策略；
采用深度 Q 学习 (Deep Q-learning, DQN) 算法对该图神经网络的参数进行训练；
TSP问题求解效果接近Bello的方法，其他问题也得到了接近最优化的解
Mittal 等
模型架构与Dai一样；
采用图卷积神经网络（GCN）；
用于求解最大覆盖问题（MCP）、MVC问题等表现更加优秀
Li 等
与 TSP 问题不同, 对节点选择的顺序无要求;
使用 GCN 图神经网络直接输出所有点选择概率的估计值, 并基于该估计值以引导树搜索的方式构造可行解；
采用 Hindsight loss 方式输出多个概率分布, 在此基础上进行树搜索, 并采用局部搜索的方式对解进行再处理；
用于求解最小顶点覆盖问题、最大独立点集 (Maximal independent set, MIS)、极大团 (Maximal clique, MC)、适定性问题 (Satisfiability)

基于指针网络的方法适合有序列特性的组合优化问题，而图神经网络待解决的问题有无序列特性都可以。

2. 基于DRL的局部搜索改进算法

Chen 等
基于深度强化学习的组合优化问题搜索模型 NeuRewriter；
其策略由两部分构成: Region-picker 和 Rule-picker；
章利用 Actor-critic 方法对 Region-picker 和 Rule-picker 策略进行了训练；
其优化效果在作业车间调度问题上超越了 DeepRM和 Google OR-tools 求解器, 在 VRP 问题上超越了 Google OR-tools 求解器

Yolcu 等
利用深度强化学习对局部搜索中变量选择算子进行学习;
采用图神经网络对变量选择的策略进行参数化;
利用 REINFORCE 算法更新图神经网络的参数;
更少的步数内找到最优解，但时间更长

Gao 等
利用深度强化学习方法对大规模邻域搜索的 Destroy 和 Repair 算子进行学习；
采用图注意力神经网络 (Graph attention network) 对问题特征进行编码；
采用基于循环神经网络的解码器输出 Destroy 和 Repair 算子；
在解决CVRP问题上超越了Kool的方法

Lu 等
提出了Learn to improve (LSI)方法；
采用局部搜索的方式；
采用了 9 种不同的提升算子作为算子库；
采用深度强化学习训练提升算子的选择策略；
每次迭代, 算法根据问题特征和当前的解, 利用学习到的策略从算子库中选择提升算子

效果和速度都堪称一绝

3. 基于DL的多目标组合优化算法

Li 等
DRL-MOA；
借鉴 Pointer network 模型采用端到端的求解框架, 采用基于分解的思想将多目标问题分解为多个子问题；
效率远高于传统算法，泛化性好

4. 总结对比

端到端模型具有求解速度远超传统优化算法的优势；
但是很难保证解的优化效果
强化学习训练方法收敛比监督式训练方法慢, 但强化学习得到的模型具有更强的泛化能力.

四、应用综述

具体文献及方法省略，详情见原文。

1. 网络与通信领域

（1）资源分配

将有限的 CPU、内存、带宽等资源分配给不同的用户或任务需求

（2）拓扑与路由优化

对路由策略、传感器的连接拓扑进行优化, 以降低通信时延和成本

（3）计算迁移

通过将部分计算任务从本地迁移到远程设备以解决移动终端资源受限问题的一个有效途径

2. 其他领域

（1）交通领域

货物配送、城际交通规划、网约车（订单分配和四级载客区域）等

（2）生产制造领域

车间工作流调度等

（3）高性能计算领域

人工智能模型的训练是一个耗时极长的任务,合理地对计算资源进行规划和调度能够有效提高计算效率

（4）微电网能量管理领域

用电、储能等设备的启停控制；光伏发电、储氢装置、蓄电池的孤岛型复合能源系统；楼宇的智能能量管理等等

五、发展与展望

来基于深度强化学习的组合优化方法在多种组合优化问题上展示出了良好性能, 具有较强的泛化性能和快速的求解速度

1. 模型方面

直接采用深度神经网络模型输出的解通常较差, 大部分文献都需要进一步通过波束搜索、局部搜索、采样策略等方式进一步提升解的质量。
如何有效结合图神经网络和 Attention 机制是一个较好的研究点。
目前的机构关系仅限于节点、边和邻居节点。能否根据图论，去探寻更深层次的结构关系呢？

2. 研究对象方面

多目标优化、约束优化问题

3. 深度强化学习训练算法方面

目前对端到端模型的训练大多采用 REINFORCE、DQN 等传统训练算法, 具有采样效率低、收敛慢等缺陷, 如何根据组合优化问题的特性设计更加高效的强化学习训练算法

4. 工程实际方面

探索解决工程实际上的问题

总结

JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
PHP接单涨薪系列（八）之AI内容工厂：用PHP批量生成SEO文章系统（2025接单秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI 人工智能 php android
某SEO团队采用本方案后，内容产出效率提升10倍，网站流量3个月增长300%，单月通过内容外包获利超¥50,000。本文将揭秘如何用PHP+AI打造全自动SEO内容工厂，让你成为搜索引擎优化领域的抢手人才！一、SEO市场新机遇：AI内容生成的红利期1.12025年SEO行业巨变搜索引擎算法升级2025核心变革SGE体验优化EEAT权重提升多模态内容整合2025年SEO关键数据：指标20232025
协同过滤算法：挖掘用户偏好，精准推荐商品 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
1.背景介绍协同过滤（CollaborativeFiltering，CF）作为推荐系统中的重要技术，其核心思想是利用用户和物品间的行为数据，挖掘用户隐性偏好，从而实现精准推荐。自20世纪90年代提出以来，协同过滤算法已经在电子商务、社交媒体、音乐视频等多个领域中广泛应用，取得了显著的推荐效果。协同过滤算法主要分为基于用户的协同过滤和基于物品的协同过滤两种。基于用户的协同过滤通过比较用户间的相似性，
SQL注入与防御-第四章-6：窃取哈希口令在安全厂商修设备 SQL注入与防御 sql 网络安全 web安全
SQL注入利用——窃取哈希口令一、核心逻辑：哈希口令的价值与窃取路径数据库中，用户口令通常以哈希形式存储（防明文泄露）。攻击者通过SQL注入窃取哈希后，可：暴力破解：用工具（如JohntheRipper）枚举原始口令。横向渗透：利用“用户reused口令”（同一口令用于多系统）入侵其他设备。不同数据库的哈希存储位置、算法差异极大，需针对性分析。二、SQLServer：哈希存储与窃取（分版本）（一）
真题训练1-算法思维训练不懂的浪漫数据结构与算法算法题
真题训练1-算法思维训练文章目录真题训练1-算法思维训练前言项目环境例题1：斐波那契数列例题2：判断一个数组中是否存在某个数参考前言第十四章《通用解题的方法论》我们讨论了解题的方法论，宏观上可以分为以下4个步骤：复杂度分析，估算问题中的复杂度的上限和下限。定位问题，根据问题类型，确定采用何种算法思维。数据操作分析，根据增、删、查和数据顺序关系选择合适的数据结构，利用空间换时间的思想。编码实现。本章
供应链管理：MES制造执行系统与APS高级排程系统解析快雪时晴-初晴融雪供应链管理供应链管理
一、MES制造执行系统与APS高级排程系统解析维度MES制造执行系统APS高级排程系统定义制造执行系统，用于管理和监控制造过程，实现生产过程的实时监控、数据采集、质量管理、工艺执行等功能。高级计划与排程系统，通过优化算法和模型，在有限资源条件下制定最优生产计划，提高生产效率和灵活性。核心功能-生产计划与调度：细化ERP计划为可执行工单，动态调整生产进度。-生产过程管理：记录工序执行情况，实时监控异
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
【极光优化算法+分解对比】VMD-PLO-Transformer-LSTM多变量时间序列光伏功率预测Matlab代码 matlab科研助手算法 transformer lstm
✅作者简介：热爱数据处理、建模、算法设计的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍光伏发电作为一种清洁能源，其功率预测对于电网稳定运行和电力系统调度至关重要。然而，光伏功率具有高度的非线性和波动性，传统的预测方法难以准确捕捉其动态特性。近年来，深度学习技术在时间序列预测领域取得了显著进展，为提高光伏功率预测精度提供了新的途径
【MySQL基础】MVCC多版本并发控制 scj1022 MySQL mysql
文章目录MVCC-多版本并发控制一、MVCC概述1、三种并发场景2、当前读&快照读3、MVCC的作用4、结合MVCC处理并发问题二、MVCC实现原理1、隐式字段2、回滚日志UndoLog3、一致性视图ReadView1）什么时候生成？2）可见性判断3）可见性算法（属性）4）可见性算法（实现）5）可见性算法（小结）4、举例说明（版本链）三、MVCC与可重复读RR1、事务的启动时机2、事务A读取流程3
【算法训练营Day07】字符串part1
文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344.反转字符串双指针法，两个指针的元素直接调转即可classSolution{publicvoidreverseString(char[]s){inthead=0;intend=s.length-1;while(head=k){reverseString(charArray,head,head+k-1);}else{reverseSt
对称加密及AES加密算法一只牛_007 安全加密解密非对称
目录一、对称加密 1、什么是对称加密？ 2、对称加密的工作过程 3、对称加密的优点 4、对称加密的两大不足二、AES加密算法 1、什么是AES加密算法及AES加密算法的形成过程 2、AES的加密流程（要理解AES的加密流程，会涉及到AES的五个关键词：分组密码体制、Padding、初始向量IV、密钥、四种加密模式） 3、AES的加密原理（要理解AES的加密原理，会涉及到AES的四个关键词：密钥扩展
[代码随想录算法训练营 Day09 字符串 Part2] yancyss 算法 python 开发语言
Day09文章目录Day09字符串6.实现strStr（力扣28）7.重复的子字符串（力扣459）字符串今天两道KMP：KMP功能，在一个字符串中找到是否出现另一个字符串本篇会再更新~6.实现strStr（力扣28）题目描述：找出字符串中第一个匹配项的下标heystack干草堆，needle针，大海捞针~思路：KMP算法B站一个讲的很好的视频整体思路：假设有主串n和模式串m，在暴力算法当中，每当主
DAY08 算法训练营| 字符串part01 天空的孩子算法
344.反转字符串-力扣（LeetCode）字符串和数组算法题目思路类似反转字符串是经典双指针法（回忆反转链表，有序数组的平方，三数之和，四数之和）classSolution{public:voidreverseString(vector&s){len=s.length();for(inti=0,j=s.size()-1;iusingnamespacestd;intmain(){strings;/
寻路算法作品集勤奋的大熊猫 Python学习之路 Python 寻路算法
寻路算法作品集正文初始点与结尾点均具有方向性的自动寻路算法（不包含限制点）正文初始点与结尾点均具有方向性的自动寻路算法（不包含限制点）如果大家觉得有用，就点个赞让更多的人看到吧~
Python pip：包的云计算部署
Pythonpip：包的云计算部署关键词：Pythonpip、云计算部署、包管理、虚拟环境、云平台摘要：本文围绕Pythonpip进行包的云计算部署展开深入探讨。首先介绍了Pythonpip在包管理中的重要性以及云计算部署的背景和意义。接着详细阐述了pip的核心概念和工作原理，包括其与Python生态系统的紧密联系。通过具体的Python代码示例，讲解了pip包管理的核心算法原理和操作步骤。同时，
余数定理问题和余数类问题的解法 wangychf python 抽象代数
一、引言Python里面有一个重要的求模运算符号“％”，作为一个小白，实验了好多次求模的运算，发现这个算法不同于一般的四则运算，其运算效率简直可以用神奇来形容。例如以当今知道的最大质数——梅森素数为例，进行求模计算，速度快得惊人。当前知道的最大的梅森素数是第51个梅森素数，也是迄今为止知道的最大的素数。它的表示为：2^82589933–1,如果用十进制打开，这个数有24862048位，是2018年
【python深度学习】DAY 51 复习日抽风的雨610 【打卡】Python训练营 python 深度学习开发语言
作业：day43的时候我们安排大家对自己找的数据集用简单cnn训练，现在可以尝试下借助这几天的知识来实现精度的进一步提高1.读取数据使用CIFAR-10图像数据importtorchfromtorchvisionimportdatasets,transforms#数据预处理transform=transforms.Compose([transforms.ToTensor(),transforms.
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
微算法科技（NASDAQ MLGO）开发基于量子搜索算法的多方量子密钥协议
随着量子信息技术的快速发展，传统加密技术面临量子计算带来的破解威胁。密码技术是网络安全的基石，而量子信息安全则使用基于量子物理和数据算法的密码技术，嵌套在网络的不同环节，提供额外的安全层。量子密钥分发（QKD）作为量子信息安全的核心技术之一，正在逐步走向实际应用。微算法科技（NASDAQMLGO）开发基于量子搜索算法的多方量子密钥协议，旨在提升信息安全水平。基于量子搜索算法的多方量子密钥协议是一种
分布式领域后端服务的限流算法实现大厂资深架构师 Spring Boot 开发实战分布式算法 wpf ai
分布式领域后端服务的限流算法实现关键词：分布式系统、限流算法、令牌桶、漏桶、滑动窗口、Redis、高并发摘要：本文深入探讨分布式系统中后端服务的限流算法实现。我们将从基础概念出发，详细分析各种限流算法的原理和适用场景，包括计数器算法、滑动窗口算法、令牌桶算法和漏桶算法。文章将提供Python实现代码和数学建模，并通过实际案例展示如何在分布式环境中使用Redis实现高效的限流机制。最后，我们将讨论限
深度学习数据集加载 Ethan@LM 深度学习人工智能
数据集结构E:\Mytest\test20250622\pythonProject\dataset├──rose│├──rose1.jpg│├──rose2.jpg│└──...└──sunflower├──sunflower1.jpg├──sunflower2.jpg└──...主要只有的两个类fromtorch.utils.dataimportDatasetfromtorchvisionimp
50个Java+SpringBoot+Vue毕业设计选题（含技术栈+核心功能） 21光年 java spring boot vue.js 毕业设计毕设
适合人群：计算机专业毕业设计/实战项目/求职作品技术亮点：前后端分离、主流技术栈、多领域覆盖一、电商与交易类智能推荐电商平台技术栈：SpringBoot+Vue+Redis+Elasticsearch核心功能：协同过滤推荐算法、秒杀系统、物流跟踪二手商品交易平台技术栈：SpringBoot+Vue+OSS存储核心功能：多维度检索、信用评分、实名认证社区团购管理系统技术栈：SpringBoot+Vu
纹理贴图算法研究论文综述点云SLAM 算法图形图像处理算法纹理贴图计算机图形学计算机视觉人工智能虚拟现实（VR）纹理贴图算法综述
纹理贴图（TextureMapping）是计算机图形学和计算机视觉中的核心技术，广泛应用于三维重建、游戏渲染、虚拟现实（VR）、增强现实（AR）等领域。对其算法的研究涵盖了纹理生成、映射、缝合、优化等多个方面。1.引言纹理贴图是指将二维图像纹理映射到三维几何表面上，以增强模型的视觉真实感。传统方法主要关注静态几何模型上的纹理生成与映射，而近年来，随着多视角图像重建、RGB-D扫描、神经渲染的发展，
Java解古代案例鸡兔同笼问题（穷举法）阿猫的故乡 java编程 eclipse java
问题：鸡兔同笼，上有35头，下有94只，求鸡兔各有多少只！问题分析：穷举算法的基本思想就是依赖于计算机的强大计算能力从所有可能情况中搜索正确的答案，穷举算法虽然效率不高，但是适合于一些没有明显规律可循的场合。使用穷举算法时，需要明确问题答案的范围，这样才可以在指定范围内搜索答案。指定范围后，就可以使用循环语句和条件判断语句逐步验证候选答案的正确性，从而搜索出正确答案。在以前设未知数x，求鸡兔问题，
华为OD 机试 2025 B卷 - 求解连续序列 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试华为OD机试 2025B卷华为OD2025B卷华为机试2025B卷
求解连续序列华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述已知连续正整数数列{K}=K1,K2,K3…Ki的各个数相加之和为S，i=N(0
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

深度强化学习的组合优化[1] 综述阅读笔记

文章目录

前言

零、组合优化问题基础

1. 定义

（1）定义

（2）常见问题

2. 方法

（1）精确方法

（2）近似方法

（3）深度学习方法

3. 文章架构

一、概述

1. 神经网络

（1）Hopfield 网络

（2）指针网络Ptr-Net

（3）图神经网络

3. 深度强化学习DRL

（1）端到端方法

（2）改进传统方法

二、原理

1. Pointer Network

（1）求解TSP问题

（2）Attention机制

2. Pointer Network+DRL

（1）求解TSP问题

（2）REINFORCE强化学习算法

3. 图神经网络

（1）图定义

（2）经典GNN

三、理论与方法

1. 基于DRL的端到端算法

（1）基于Pointer Network-Seq2Seq

（2）基于Pointer Network-Transformer

（3）基于图神经网络

2. 基于DRL的局部搜索改进算法

3. 基于DL的多目标组合优化算法

4. 总结对比

四、应用综述

1. 网络与通信领域

（1）资源分配

（2）拓扑与路由优化

（3）计算迁移

2. 其他领域

（1）交通领域

（2）生产制造领域

（3）高性能计算领域

（4）微电网能量管理领域

五、发展与展望

1. 模型方面

2. 研究对象方面

3. 深度强化学习训练算法方面

4. 工程实际方面

总结

你可能感兴趣的:(个人笔记,算法,深度学习)