斯曦巍峨

《Learning Combinatorial Optimization Algorithms over Graphs》阅读笔记

一.文章概述

本文提出将强化学习和图嵌入的组合以端到端地自动为图上组合优化问题设计贪心启发式算法，以避免设计传统算法所需要的大量专业知识和试错。学得的贪心策略行为类似增量构造解决方案的元算法，动作由解决方案当前状态上的图嵌入网络确定。作者提出方案学得的启发式算法对多个不同的组合优化问题、图类型和大小都有效。

元算法：meta algorithm，通用框架，可用于解决许多问题。

二.背景介绍

解决NP-hard图优化问题的方法主要分为三类：

精确算法：基于枚举或带整数规划形式的分支限界，对大型实例不适用。
近似算法：多项式逼近算法是可取的，但可能会受到弱最优性保证或经验性能的影响，或者对于不可逼近的问题甚至可能不存在。
启发式算法：通常是快速有效的算法，但缺乏理论保证，并且可能还需要算法设计者进行大量针对特定问题的研究和试错。

上述三种范式都很少利用现实世界优化问题的一个共同特征：同一类型问题的实例在常规基础上被一次又一次地解决，保持相同的组合结构，但主要在数据上有所不同。为此作者提出，给定一个图优化问题 $G$ 和分布 $\mathbb{D}$ ，是否能从 $\mathbb{D}$ 中学习到更好的启发式方法来推广到未见的实例？

现有基于深度学习方法的不足之处：

使用的深度架构是通用的，不能有效地反映图问题的组合结构。
需要大量的实例来提升方法的泛化性能。
现有工作通常基于策略梯度进行训练，这种方法并不是特别有效的样本。
需要繁琐的人工特征工程。

基于现状，作者使用强化学习和图嵌入的独特组合来解决图问题的学习算法的挑战。学习到的策略行为类似于增量构造解决方案的元算法，动作由解决方案当前状态上的图嵌入网络确定。作者提出的架构与以往的工作由以下几个方面的不同：

算法设计模型：采用贪心元算法设计，根据图的结构，通过节点的连续添加构造可行解，并保持可行解满足问题的图约束。
算法表示：使用structure2vec的图嵌入网络来表示贪心算法中的策略，该网络能捕获节点在其图邻域上下文中的属性。这允许策略根据节点的有用性来区分它们，并推广到不同大小的问题实例。
算法训练：使用拟合Q-learning来学习一个由图嵌入网络参数化的贪心策略。策略的目标是直接优化原始问题实例的目标函数。该方法的主要优点是可以以数据高效的方式处理延迟奖励（贪心算法获取的目标函数值的剩余增量）；在贪心算法的每一步中，根据部分解更新图嵌入，以反映每个节点对最终目标值的效益的新知识。相比之下，策略梯度只对整个解决方案更新一次模型参数。

作者提出的框架如下所示：

三.图上贪心算法通用范式

作者使用有权图上的三个优化问题来说明其框架。令 $G (V, E, w)$ 表示有权图，其中 $V$ 表示节点集， $E$ 表示边集， $\rightarrow \mathbb{R}^{+}$ 表示边权重函数， $w (u, v)$ 表示边 $\in E$ 的权重。

基于此，作者解决的三个优化问题表示如下：

Minimum Vertex Cover (MVC)：给定图 $G$ ，寻找节点子集 $\subseteq V$ ，使得任意边都有端点在 $S$ 中。
Maximum Cut (MAXCUT)：给定图 $G$ ，寻找节点子集 $\subseteq V$ ，使得cut-set的权重之和 $\sum_{(u, v) \in C} w(u, v)$ 最大，其中cut-set $\subseteq E$ 中每条边的一段在 $S$ 中，另一端在 $\ S V \backslash S$ 中。
Traveling Salesman Problem (TSP)：给定二维空间的点集，以每个点为图节点，点间的距离作为点间边的权重，该问题旨在寻找一个总权值最小的tour，tour指访问图中每个顶点仅一次的环。

**贪心算法基于最大化某个评估函数 $Q$ （通过 $Q$ 衡量当前局部解背景下一个节点的质量），在局部解S中依次添加节点来构造一个解。**作者指出上述问题的贪心算法可以用一个共同的公式来表示：

一个给定优化问题的问题实例 $G$ 是从分布 $\mathbb{D}$ 中采样的，即实例图 $G$ 的 $V 、 E$ 和 $w$ 是根据模型或真实世界的数据生成的。
一个部分解决被表示为一个有序的list $S=\left(v_1, v_2, \ldots, v_{|S|}\right), v_i\in V$ , 和 $\ S \bar{S}=V\backslash S$ 待添加的候选节点集。作者使用一个二元决策变量的向量 $x$ ，每个维度 $x_v$ 对应于 $V$ 中的一个节点 $v$ ，如果 $v\in S$ ， $x_v=1$ ，否则为0。可以把 $x_v$ 看作是 $v$ 上的一个标签或额外的特征。
需要一个维护(或辅助)过程 $h (S)$ ，其将有序列表 $S$ 映射到一个满足问题特定约束的组合结构。
部分解决 $S$ 的质量是由基于 $S$ 的组合结构 $h$ 的目标函数 $c (h (S), G)$ 给出的。
一个通用的贪婪算法能使评估函数 $\in \mathbb{R}$ 最大化的节点 $v$ 作为下一个添加到部分解 $S$ 中的节点，这取决于当前部分解决方案的组合结构 $h (S)$ ，即部分解可以扩展为：
$S:=\left(S, v^*\right) \text {, where } v^*:=\operatorname{argmax}_{v \in \bar{S}} Q(h(S), v)$
其中 $S, v^*)$ 表示在list $S$ 尾端添加节点 $v^*$ 。该步骤会重复直到满足终止条件 $t (h (S))$ 。

对于以上抽象模型（分布 $\mathbb{D}$ 、辅助函数 $h$ 、终止准则 $t$ 和代价函数 $c$ ），三个问题具体设计如下：

MVC：辅助函数 $h$ 不需要做任何工作， $c (h (S), G) = - ∣ S ∣$ 。终止条件是检查是否所有边都被覆盖。
MAXCUT：辅助函数将 $V$ 划分为两个子集 $S$ 和其补集 $\ S \bar{S}=V \backslash S$ 并维持cut-set $C=\{(u, v) \mid(u, v) \in E, u \in S, v \in \bar{S}\}$ 。代价函数是 $G)=\sum_{(u, v) \in C} w(u, v)$ ，无终止条件。
TSP：辅助函数根据 $S$ 中的节点顺序维护一个tour。最简单的方法是按照 $S$ 的顺序将节点追加到部分旅游的末尾。代价函数为 $G)=-\sum_{i=1}^{|S|-1} w(S(i), S(i+1))-w(S(|S|), S(1))$ ，终止条件是 $S = V$ 。根据经验，在部分tour中插入一个节点 $u$ ，使tour长度增加最少的位置是一个更好的选择。作者以此作为TSP的辅助函数。

在部分解 $S$ 中添加一个节点所产生的解决方案质量的估计值将由评估函数 $Q$ 决定，该函数将通过使用问题实例的集合来学习。这与传统的贪心算法设计相反，在传统算法中需要手工设计 $Q$ ，并且需要大量针对特定问题的研究和试错。

四.图嵌入表示

对于评估函数 $Q$ ，作者希望其考虑到当前部分解 $S$ ，因为它映射到图上。即对所有节点 $\in S$ ， $x_v=1$ ，节点按照图结构进行连接。直观地说， $\widehat{Q}$ 应该总结"有标签的 "图 $G$ 的状态，如果要在该图背景下添加新节点，就应该算出它的价值。在这里，图的状态和节点 $v$ 的上下文都可能非常复杂，难以用封闭形式描述，而且可能取决于复杂的统计数据，如全局/局部度分布、三角形计数、与标记节点的距离。为了在组合结构上表示如此复杂的现象，作者在图上利用深度学习架构，即structure2vec来参数化 $\widehat{Q}(h(S), v ; \Theta)$ 。

4.1 Structure2Vec

给定当前部分解 $S$ ，structure2vec会为每个节点 $\in V$ 计算 $p$ 维的特征嵌入 $\mu_v$ 。更具体地说，structure2vec根据输入图结构 $G$ 递归地定义网络架构，structure2vec的计算图受到图模型推断算法的启发，其中节点特定的标签或特征 $x_v$ 根据 $G$ 的图拓扑递归地聚合。经过多次迭代，网络将为每个节点产生一个新的嵌入，同时考虑到图特征和这些节点特征之间的远程交互。structure2vec的一个变体是将嵌入 $\mu_v^{(0)}$ 初始化为0，对所有 $\in V$ ，在每次迭代中将嵌入同步更新为：
$\mu_v^{(t+1)} \leftarrow F\left(x_v,\left\{\mu_u^{(t)}\right\}_{u \in \mathcal{N}(v)},\{w(v, u)\}_{u \in \mathcal{N}(v)} ; \Theta\right)$
其中 $\mathcal{N}(v)$ 表示节点 $v$ 的邻居集， $F$ 表示神经网络或核函数。

4.2 Parameterizing $\widehat{Q}$

基于structure2vec，作者定义的嵌入更新方式为：
$\mu_v^{(t+1)} \leftarrow \operatorname{relu}\left(\theta_1 x_v+\theta_2 \sum_{u \in \mathcal{N}(v)} \mu_u^{(t)}+\theta_3 \sum_{u \in \mathcal{N}(v)} \operatorname{relu}\left(\theta_4 w(v, u)\right)\right)$
$\theta_1 \in \mathbb{R}^p, \theta_2, \theta_3 \in \mathbb{R}^{p \times p}$ 和 $\theta_4 \in \mathbb{R}^p$ 都是模型的参数， $\text{relu}$ 表示非线性激活。经过 $T$ 轮迭代，作者使用这些嵌入来定义 $\widehat{Q}(h(S), v ; \Theta)$ 。即作者使用每个节点 $v$ 的嵌入和整个图上的池化嵌入 $\sum_{u \in V} \mu_u^{(T)}$ ，作为 $v$ 和 $h (S)$ 的代用品，即：
$\widehat{Q}(h(S), v ; \Theta)=\theta_5^{\top} \operatorname{relu}\left(\left[\theta_6 \sum_{u \in V} \mu_u^{(T)}, \theta_7 \mu_v^{(T)}\right]\right)$
其中 $\theta_5 \in \mathbb{R}^{2 p}, \theta_6, \theta_7 \in \mathbb{R}^{p \times p}$ ， $[\cdot, \cdot]$ 表示拼接操作。作者将 $T$ 设置的很小（因为会过平滑）。对于训练，作者使用的是强化学习。

五.训练：Q Learning

作者期望在分布 $\mathbb{D}$ 上的 $m$ 个图组成的图集 $\mathcal{D}=\left\{G_i\right\}_{i=1}^m$ 上学得函数 $\widehat{Q}$ 。

5.1 强化学习公式

作者对强化学习框架中的状态、动作和奖励定义如下：

State：状态 $S$ 是图 $G$ 上的一系列动作（节点）。由于已经在嵌入中表示了标记图中的节点，所以状态是 $p$ 维空间中的一个向量， $\sum_{v \in V} \mu_v$ 。很容易看出，这种状态的嵌入表示可以跨不同的图使用。终止状态 $\widehat{S}$ 取决于手头的问题。
Transition：过渡是确定的，相当于用特征 $x_v=1$ 来标记被选为最后行动的节点 $\in G$ 。
Actions：动作 $v$ 是 $G$ 中的一个节点，不属于当前状态 $S$ 。同样，作者将把行动表示为其相应的 $p$ 维节点嵌入 $\mu_v$ ，这样的定义适用于各种规模的图。
Rewards：状态 $S$ 的奖励函数 $r (S, v)$ 被定义为采用行动 $v$ ，转移到新状态 $S^{\prime}:=(S, v)$ 后，代价函数的变化，即:
$v)=c\left(h\left(S^{\prime}\right), G\right)-c(h(S), G)$
其中 $c(h(\emptyset), G)=0$ 。因此，终止状态 $\widehat{S}$ 的累积奖励 $R$ 与 $\widehat{S}$ 的目标函数值完全重合，即 $R(\widehat{S})=\sum_{i=1}^{|\widehat{S}|} r\left(S_i, v_i\right)$ 等于 $c(h(\widehat{S}), G)$ 。
Policy：基于 $\widehat{Q}$ ，确定性贪心策略 $\pi(v \mid S):=\operatorname{argmax}_{v^{\prime} \in \bar{S}} \widehat{Q}\left(h(S), v^{\prime}\right)$ 被使用，选择行动 $v$ 对应于向当前部分解中添加一个 $G$ 的节点，这会导致收集奖励 $r (S, v)$ 。

表1展示了本文的三个优化问题的强化学习框架实例：

作者用 $Q^*$ 表示每个RL问题的最优 $Q$ 函数，作者用 $\widehat{Q}(h(S), v ; \Theta)$ 来近似它，这通过 $n$ 步 $Q$ 学习来习得。

5.2 学习算法

为了对 $\widehat{Q}(h(S), v ; \Theta)$ 的参数进行端到端的学习，作者使用 $n$ 步 $Q$ 学习和拟合 $Q$ 迭代的组合，具体详见算法1：

作者使用术语episode来表示从一个空解开始，直到终止的一个完整的节点添加序列，episode中的一个step表示一个单独的操作（节点添加）。

标准（1步） $Q$ 学习通过执行gradient step来最小化平方损失函数，在episode的每个step中更新函数近似器的参数：
$\left(y-\widehat{Q}\left(h\left(S_t\right), v_t ; \Theta\right)\right)^2,$
其中 $y=\gamma \max _{v^{\prime}} \widehat{Q}\left(h\left(S_{t+1}\right), v^{\prime} ; \Theta\right)+r\left(S_t, v_t\right)$ 表示状态 $S_t$ 的非终止状态。 $n$ 步 $Q$ 学习有助于处理延迟奖励的问题，在这种情况下，agent感兴趣的最终奖励只能在某一episode的未来才能收到。在作者的设置中，解决方案的最终目标值只有在添加许多节点之后才会显示出来。因此，一步更新可能太短视了，其自然扩展是等待 $n$ 步，然后更新近似器的参数，以便收集对未来奖励的更准确的估计。形式上更新仍然是在相同的损失平方上，但是目标不同， $y=\sum_{i=0}^{n-1} r\left(S_{t+i}, v_{t+i}\right)+\gamma \max _{v^{\prime}} \widehat{Q}\left(h\left(S_{t+n}\right), v^{\prime} ; \Theta\right)$ 。

当使用神经网络作为函数逼近器时，拟合 $Q$ 迭代法已被证明可以导致更快的学习收敛，这一属性也适用于本文的设置。与逐个样本更新 $Q$ 函数不同，拟合 $Q$ 迭代方法使用experience replay来更新函数逼近器，使用来自数据集 $E$ 的一批样本，而不是当前经历的单个样本。数据集 $E$ 在之前的episode中被填充，这样在step $t + n$ ，元组 $\left(S_t, a_t, R_{t, t+n}, S_{t+n}\right)$ 被添加到 $E$ ，其中 $R_{t, t+n}=\sum_{j=0}^{n-1} r\left(S_{t+i}, a_{t+i}\right)$ 。然后，从 $E$ 中抽取的随机样本进行随机梯度更新。

Q-learning这样的off-policy强化学习算法可以比其策略梯度对应的算法有更高的样本效率。这主要是由于策略梯度方法需要在函数逼近器的每次参数更新后获得的新策略的策略样本。

[langchain教程]langchain01——用langchain调用大模型古希腊掌管学习的神 LangChain langchain python 人工智能语言模型 chatgpt
什么是LangChainLangChain是一个开源框架，旨在简化基于大型语言模型（LLMs）的应用程序开发。通过模块化组件和链式结构将语言模型与外部数据源、工具和任务流程集成，构建复杂且功能强大的应用程序。核心概念组件（Components）：LangChain提供了多种模块化的构建块，如提示模板、索引、代理等，用于处理不同任务。这些组件可以动态组合，以适应不同的应用场景。链（Chains）：L
双层优化模型【简述】一只小菜鸡~ 机器学习
1.模型理解双层规划问题就是指这种优化问题：目标函数中的一组变量被约束为另一优化问题的最优解；更简单来说，就是一个优化问题问题的参数受限于另一个优化问题，这两个问题相互影响。2.数学定义公式定义：minθ,wθF(wθ,θ)suchthatwθ∈minwL(w,θ)min_{\theta,w_\theta}F(w_\theta,\theta)\quadsuch\quadthat\quadw_\th
DeepSeek V3可用的15种精美知识卡片提示词东锋17 人工智能信息可视化人工智能
视觉风格模板库尺寸规格基准尺寸：宽度400px，高度不少于1280px。比例关系：遵循3:10的垂直长卡片比例，保持竖版布局。显示方式：卡片自左向右平铺展示，保持一致的顶部对齐。响应适配：主体内容在固定宽度内，确保在不同设备上保持竖版体验。具体风格介绍01|孟菲斯解构主义(MemphisDeconstructed)设计哲学：打破常规秩序，创造有意识的视觉冲突与趣味张力。色彩系统：高饱和不协调组合（
矩阵键盘原理与单片机驱动设计详解—端口反转法（下） | 零基础入门STM32第七十八步触角01010001 STM32入门教程（100步）stm32 嵌入式硬件单片机驱动开发物联网
主题内容教学目的/扩展视频4x4阵列键盘电路连接，电路原理，驱动程序，调用函数。能用程序读出按键值。师从洋桃电子，杜洋老师文章目录一、矩阵键盘驱动架构设计1.1系统整体架构1.2硬件资源配置二、核心驱动实现分析2.1初始化函数解析2.2按键扫描流程图2.3按键解码算法三、关键技术创新点3.1动态IO模式切换3.2复合消抖策略四、扩展设计指南4.1扩展为8x8矩阵4.2多按键组合检测五、性能优化建议
Python模块与包管理完全指南深情不及里子 Python python 开发语言
一、Python模块与包的本质探秘在Python的编程世界里，模块与包是构建代码大厦的基石，它们就像是乐高积木的不同组件，以巧妙的方式组合，搭建出复杂而有序的程序结构。理解模块与包的本质，是掌握Python代码组织哲学的关键，也是迈向高效、可维护编程的第一步。1.1模块模块，简单来说，就是Python中的一个.py文件，它是Python代码组织的最小单位，如同乐高积木中的最小颗粒，每个模块都可以独
codeforces系列题参考解析_001：有趣的图与苹果（深度优先搜索及类似、并查集、图论）知识小报童深度优先图论算法
1.题目内容标题E.InterestingGraphandApples时间限制1秒内存限制64MB输入方式标准输入输出方式标准输出题目难度4(困难)题目涉及的知识点深度优先搜索及类似、并查集、图论题目描述Hexadecimal喜欢画画。她已经画了很多图，包括有向图和无向图。最近她开始创作一幅静物画“有趣的图和苹果”。一个无向图被称为有趣的，如果它的每个顶点都只属于一个环——一个有趣的环——并且不属
【ICLR 2023】Diffusion Models扩散模型和Prompt Learning提示学习：prompt-to-prompt 沉迷单车的追风少年 Diffusion Models与深度学习扩散模型 diffusion model prompt learning 提示学习
DiffusionModels专栏文章汇总：入门与实战前言：今年promptlearning提示学习和diffusionmodels扩散模型实在是太火了，最新的ICLR2023的一项工作把两者结合了起来，取得了十分惊艳的效果！正好昨天代码刚刚开源，这篇博客就和大家一起解读一下原理与代码！目录贡献概述图像编辑技术为什么是困难的？真正的text-to-image编辑论文和代码天选之子：cross-at
Franka Research 3 × NVIDIA Isaac Sim：深度强化学习开启机器人复杂操作新范式 BFT白芙堂算法人工智能机器学习 Franka 机器人
——以「开抽屉」任务为例，解析高精度机械臂的仿真训练全流程我们作为松灵机器人的授权商为用户提供灵活的解决方案如有产品购买需求请联系：[email protected]一、为什么选择FrankaResearch3+IsaacSim？行业痛点：传统机器人开柜门依赖人工示教，耗时且无法应对抽屉卡顿、物品遮挡等动态场景。组合优势：FrankaResearch3：7自由度机械臂（±0.1mm定位精度）+触
包管理工具(npm、cnpm、Yarn、CYarn) 前端_学习之路 nodejs
NPM全称：NodePackageManager,Node的包管理器，也是一个应用程序。包是什么Node.js的包基本遵循CommonJS规范，将一组相关的模块组合在一起，形成一个完整的工具作用通过NPM可以对Node的工具包进行搜索、下载、安装、删除、上传。借助别人写好的包，可以让我们的开发更加方便。安装安装完nodejs之后会自动安装npm常用命令查看npm的版本npm-v初始化npminit
python人狗大战游戏_day23 02 组合（继续人狗大战游戏） weixin_39606911 python人狗大战游戏
day2302组合(继续人狗大战游戏)面向对象的三大特性：继承多态封装先讲解一下组合组合：一个对象的属性值是另一个类的对象：对象.属性.属性(一般有两个点)继续扩展day2201里面的人狗大战的小游戏来说明组合的存在，相对于之前的游戏，这次多加了一个武器装备类，而且武器还有它的大招。首先一个武器装备所有的属性有：武器的名字，武器具有的攻击力，武器可使用的次数，购买购买该装备需要的钱，所以你每次使用
3、pytest实现参数化 Rhys.. pytest python 服务器
在pytest中，参数化（parametrization）是一种强大的功能，可以让你用不同的输入数据重复执行同一个测试函数。这种功能非常有用，可以帮助你显著减少重复代码并提高测试覆盖率。参数化的主要作用是：测试多种输入数据：确保函数对各种输入表现正确。减少重复代码：一个测试函数可以用多种不同的输入进行测试，而不需要多次编写。提高测试覆盖率：通过不同的输入组合，能够更全面地测试功能。实现参数化的基本
Python贪心算法详解：如何解决最优组合问题追逐程序梦想者 python 贪心算法开发语言点云处理
Python贪心算法详解：如何解决最优组合问题贪心算法是一种求解最优化问题的经典算法，其基本思想是在每一个阶段选择最优的策略，从而得到全局最优解。在实际应用中，贪心算法适用于一些特殊类型的问题，如背包问题、最小生成树问题、任务调度问题等。Python作为一门高级编程语言，具有简洁、易用、高效等特点，在实现贪心算法时也非常方便。下面将通过具体例子来讲解如何使用Python来实现贪心算法，以解决最优组
《Python实战进阶》No37: 强化学习入门：Q-Learning 与 DQN-加餐版1 Q-Learning算法可视化带娃的IT创业者 Python实战进阶 python 算法 pygame
在《Python实战进阶》No37:强化学习入门：Q-Learning与DQN这篇文章中，我们介绍了Q-Learning算法走出迷宫的代码实践，本文加餐，把Q-Learning算法通过代码可视化呈现。我尝试了使用Matplotlib实现，但局限于Matplotlib对动画不支持，做出来的仿动画太僵硬，所以使用pygame重新设计Q-Learning的可视化程序可以显著提升动画的流畅性和交互性。相比
leetcode40-组合总和II 记得早睡~ 算法小课堂 leetcode 数据结构 javascript 算法
leetcode40思路在做本题之前可以参考之前的文章：组合总和和组合总和III本题的关键点是：每个元素只能使用一次，另外本题给的数组是无序的，并且元素之间可能存在重复项，举个例子，candidates=[1,2,1,1]，这种可能性存在，所以本题的关键在于去重假设candidates=[1,2,1,1]，target=3可能的情况是：[1,2],[1,1,1]也就是说元素每个元素1都是一个单独的
小样本学习综述2025 wuxuand 深度学习计算机视觉深度学习人工智能
一、Few-ShotClass-IncrementalLearningforClassificationandObjectDetection:ASurvey用于分类和目标检测的少样本类增量学习：综述引用：@ARTICLE{10840313,author={Zhang,JinghuaandLiu,LiandSilvén,OlliandPietikäinen,MattiandHu,Dewen},jou
需求的INVEST原则 weixin_42679254 需求分析敏捷开发产品运营
在撰写用户故事的时候，可以参考INVEST原则：Idependent(独立的):一个用户故事对于另一个用户故事应该是独立的（尽可能的）。故事之间的依赖性使得增加了计划编制，确立有限级，故事估计这些工作非常困难。通常，可以通过组合用户故事或者分割用户故事来减少依赖性。Negotiable(便于沟通的):一个用户故事是便于沟通的。一个故事的卡片是包含故事详情的简短描述。这些详情是通过讨论阶段来完成的。
IP地址会不会影响网速？深入解析与探讨 hgdlip ip 网络 tcp/ip 网络协议网络网速
在互联网的浩瀚海洋中，每一个连接的设备都拥有一个独特的标识符——IP地址。它如同网络世界的门牌号，引导着数据包的流向，确保信息的准确传递。然而，在享受网络带来的便捷与高效时，不少用户会遇到网速波动或变慢的情况，这时一个疑问便油然而生：IP地址，这个看似简单的数字组合，是否会对我们的网速产生影响呢？虎观代理小二将带您深入探讨IP地址与网速之间的关系，揭开这一谜团，帮助大家更好地理解网络运作的奥秘。‌
屏幕刷新机制（一）：机制 yueqc1 屏幕刷新机制
屏幕刷新机制（一）：机制屏幕刷新机制（二）：Choreographer、SurfaceFlinger综述屏幕整体刷新机制：就是通过Choreographer、SurfaceFlinger，以垂直同步技术(VSYNC)加三重缓冲技术(TripleBuffer)的方案，保证CPU计算/GPU渲染（MainThreadRenderThread）与屏幕刷新率（HWComposer）的平衡与稳定。通过软件技
关于强化学习小记文弱_书生乱七八糟神经网络人工智能强化学习马尔科夫决策
强化学习（ReinforcementLearning,RL）详解1.什么是强化学习？强化学习（ReinforcementLearning,RL）是一种机器学习方法，通过**智能体（Agent）在环境（Environment）中不断尝试不同的动作（Action），并根据环境给予的奖励（Reward）**来学习最优策略（Policy），从而最大化长期回报（Return）。强化学习的核心思想：试错学习（
C# winform中chart控件加载数据量大时卡顿 4O4U c#开发语言
使用Series.CharType=Line显示折线图时，数据量过大会导致卡顿。一种解决思路：使用FastLine折线类型，该类型摒弃了marker等功能，但速度提升很大。需要显示点+线时，可以考虑使用FastLine+FastPoint组合
Spring Boot网站性能优化全解析 weixin_30777913 spring boot 性能优化 linux java jvm
在开发SpringBoot网站时，性能优化涵盖Java应用、操作系统、Java虚拟机（JVM）等多个层面。下面将从SpringBoot应用层、Linux系统、JVM参数等方面，详细介绍优化方案，同时阐述操作系统差异处理、验证与监控以及注意事项。通过以下多层级优化组合，可实现从应用代码到系统底层的整体性能提升。建议依据实际监控数据持续调优，不同场景侧重不同优化方向。一、SpringBoot应用层优化
python struct pack解析_python struct.pack() 二进制文件，文件中打包二进制数据的存储与解析... weixin_39609407 python struct pack解析
学习Python的过程中，遇到一个问题，在《Python学习手册》(也就是《learningpython》)中，元组、文件及其他章节里，关于处理二进制文件里，有这么一段代码的处理：>>>F=open('data.bin','wb')>>>importstruct>>>data=struct.pack('i4sh',7,'spam',8)>>>datab'\x00\x00\x00\x07spam\x
deepseek(1)——deepseek 整体架构哦豁灬学习笔记深度学习大模型 deepseek LLM 大模型
deepseek最新的主要是两个模型：通用多模态大模型deepseek-v3，671B，通用模型，用于常见日常问题推理模型deepseek-r1,671B，推理模型，擅长处理复杂、需要多步思考的问题，适合做深度研究、解决代码/数学问题DeepSeek-R1是首个验证了仅通过RL（强化学习）无需SFT（监督微调）就能得到大幅推理能力增强和涌现的模型。这种训练方式大幅降低了数据标注成本，简化了训练流程
机器学习经典算法：决策树原理详解 xiaoyu❅ 机器学习算法决策树
决策树（DecisionTree）是一种直观且强大的机器学习算法，被广泛用于分类与回归任务。本文从核心原理（信息熵、基尼系数）、构建过程（ID3/C4.5/CART）、剪枝优化到Python代码实战，全方位解析决策树，并教你如何用Graphviz可视化树结构！目录一、什么是决策树？二、决策树的核心原理1.特征划分标准2.关键公式推导3.决策树构建流程三、Python代码实战1.数据集准备2.模型训
只需三步，就可以在KubeBlocks上集成和使用NebulaGraph集群啦！
NebulaGraph是一款开源分布式图数据库，凭借高可用、可扩展、易运维、高性能等特性，NebulaGraph已被美团、京东、快手和腾讯等多家企业选用，应用于数据治理、实时推荐、反欺诈、风险控制等多种场景。数据库的部署和运维是常见的用户痛点。对于开源数据库，上手难度则更高，因为用户往往需要自己不断摸索如何完成这些事情，这也对开源数据库的流行度带来不利的影响。因此，开源数据库社区中往往都会有开发者
机器学习入门第三集——如何完整实现一次模型训练梯度寻优者_超机器学习人工智能 python 算法大数据回归数据分析
提示：如何完整的从数据导入到最后模型训练以及模型保存，本集进行介绍。文章目录上集回顾一、数据集是什么？二、完整训练过程1.导入数据2.数据集划分3.模型训练4.模型保存以及加载总结下集预告上集回顾提示：上集已经对机器学习基础知识分类常用算法等进行了描述，这集开始是如何完整训练模型，前两集已经介绍了机器学习的通俗解释，已经常见分类，还有机器学习深度学习强化学习的关系和区别。有想看的小伙伴可以翻我主页
第 1 章 Python 入门 ___Y1 python windows 数据库
各位在学习新技术或新编程语言时，是否对准备工作发过愁呢？往往学习还没有正式开始，就先在准备工作上迷失了方向。好不容易硬着头皮开始准备，却发现安装完一个软件之后又不知道该干什么了。最后自以为准备完毕兴冲冲地要开工时，才注意到应该装好的东西并没有正确安装。到头来，大把的时间花在了准备阶段上，再无心情去学习了。类似这种情况不知道各位遇到过没有。搭建Python开发环境时要考虑OS与版本等诸多组合，所以这
npm: browserslist插件（webpack搭配.browserslistrc筛选符合要求的版本浏览器）小强有个dream webpack node webpack javascript 前端
官网文档链接BrowsersDataUpdating浏览器数据更新QueryComposition查询组合Browsers现存的浏览器ConfigFile配置文件ShareableConfigs可以共享的配置ConfiguringforDifferentEnvironments针对不同环境进行配置CustomUsageData自定义使用数据JSAPIEnvironmentVariables环境变量
0 - 1 背包问题介绍与 C# 代码实现 CoreFMEA软件技术算法 c#开发语言背包问题算法
0-1背包问题介绍0-1背包问题是一个经典的组合优化问题，属于NP完全问题。问题描述如下：给定一组物品，每个物品有对应的重量w[i]和价值v[i]，以及一个容量为C的背包。要求在不超过背包容量的前提下，选择一些物品放入背包，使得背包中物品的总价值最大。这里的“0-1”表示对于每个物品，只能选择放入背包（1）或者不放入背包（0），不能只放入部分物品。解决思路-动态规划虽然贪心算法在某些情况下可以用于
pytorch与其他ai工具 weixin_47868976 人工智能 pytorch python
PyTorch、TensorFlow及其他工具面试考点与回答策略一、PyTorch高频考点与回答模板1.核心特性与原理动态计算图（DynamicGraph）考点：动态图与静态图的区别、优缺点。回答：“PyTorch使用动态图（Define-by-Run），允许在运行时修改计算逻辑，调试直观（如print张量值），适合研究场景；缺点是部署时需转为静态图（TorchScript）以优化性能。”自动微分
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen