Bugu Lee

凸优化：梯度下降、回溯线搜索（Backtracking line search）

机器学习或强化学习的很多算法直接或间接地使用了最优化（Optimization）算法（如回溯线搜索、信赖域等）。例如，强化学习中引入信赖域方法产生了TPRO（Trust Region Policy Optimization）算法、在训练机器学习模型的过程中，求最小化损失函数时应用了线搜索的方法。为了更好的理解这些知识，本文主要对梯度下降和线搜索进行总结。

在最优化问题中，找函数f(x)的一个局部最小值 $x^{*}$ 有两种基本迭代方法：线搜索和信赖域。本质上它们的作用都是在优化迭代过程中从当前点找寻下一点。它们的最大区别是先确定步长还是先确定方向。线搜索（Line search）方法先确定方向再确定步长，而信赖域(Trust region)方法则先把搜索范围缩小到一个小的范围，小到能够用另一个函数（Model function）去近似目标函数（Objective function），然后通过优化这个model function来得到参数更新的方向及步长。

本文从凸优化问题中的无约束最小化问题引出线搜索。在凸优化问题中，无约束最小化问题（unconstrained minimization problem），数学描述为

$\;f(x)$

其中函数f(x)是凸的，且二阶连续可微。

如果是只想了解线搜索、回溯线搜索，可以跳过下面的下降方法部分。

1 下降方法（Descent methods）

所有的无约束最小化算法都会生成一个最小化序列 $x^{1},x^{2},...,x^{n}$ ,其中，

$x^{(k+1)} = x^{(k)} +t^{(k)} \Delta x^{(k)}$

且 $t^{(k)} > 0$ （除了当 $x^{(k)}$ 是最优时）。其中， $\Delta x^{(k)}$ 称为搜索方向或下降方向；k=0，1，2，…表示迭代次数。标量 $t^{(k)} > 0$ 称为第k次迭代的步长（step size），上式称为下降更新。

注：上述所谓最小化序列 $x^{1},x^{2},...,x^{n}$ 是指使f(x) 最小化的x的离散点。

所有的下降方法都有，

$f(x^{(k+1)}) < f(x^{(k)} )$

除了当 $x^{(k)}$ 是最优时（最优时 $\Delta x^{(k)} =0, x^{(k+1)} =x^{(k)}$ ）。

从凸函数性质可得，

$\nabla f(x^{(k)}) \Delta x^{(k)} < 0$

上式表明两者方向相反 $\Delta x^{(k)} = -\nabla f(x^{(k)})$ ，个人理解，如果梯度（ $\nabla f(x^(k))$ ）小于0，搜索方向沿增加x方向（即 $\Delta x^{(k)} >0$ ），反之亦然。如下图所示，

$\Delta x^(k)$ 的方向和 $\nabla f(x^{(k)})$ 的方向相反如下图所示， $\Delta x^(k)$ 和 $-\nabla f(x^(k))$ (梯度反方向) 构成锐角。我们把这个方向称为下降方向（descent direction）

一般下降方法算法如下：

上述算法很简单，第一步，找到下降方向，根据 $\nabla f(x^{(k)} \Delta x^{(k)} < 0$ 这个条件来确定方向（其中 $\Delta x^{(k)}=-\nabla f(x^{(k)})$ 是可选的方向之一，这就是梯度下降的方向）；第二步，用线搜索（line search）找一个步长；第三步更新最小化序列。

若在上述算法中的第一步，下降方向选择 $\Delta x^{(k)}=-\nabla f(x^{(k)})$ ，即梯度方向，就成了梯度下降算法。可见梯度下降算法是一般下降算法的特殊情况，一般下降包括了梯度下降。梯度下降方法算法如下：

上述两个算法采用线搜索或回溯线搜索（Backtracking line search）来选择搜索的步长。

2 线搜索（Line search）

线搜索方法先找一个下降方向（沿此下降方向时目标函数f(x)的值减小），然后计算步长来决定x沿着下降方向移动多远。其中，下降方向有各种各样的计算方法，如梯度下降、牛顿法、或拟牛顿法(Quasi-Newton Methods)。

线搜索分为精确线搜索（Exact line search）和不精确线搜索（inexact line search）。精确线搜索，顾名思义，每次迭代的目标都是找到使目标函数f(x)取得精确的最小值的点。不精确线搜索，就是不需要找到精确最小值，而是使目标函数满足了某个条件即可(如目标函数值下降了多少)，其中常见的条件有Wolfe条件（Wolfe conditions）和Goldstein条件（ Goldstein conditions）。线搜索有广泛的应用，如机器学习，博弈论及其他领域。

注：下面的内容主要来自Stephen Boyd&Lieven Vandenberghe的《Convex optimization》和Jorge Nocedal&Stephen J. Wright的《numerical optimization》。两本书在表示符号上存在差异：主要是步长和方向表示不一致，
$x_{k}+a_{k}p_{k}$
$\Delta x$
上面两个式子都表示迭代更新， $a_{k}或t$ 表示步长， $p_{k} 或\Delta x$ 表示方向。下文中会混合使用两种符号。

2.1 精确线搜索（Exact line search）

广义的说，线搜索法是一种迭代方法，用于使用多维非线性函数的梯度来找到该函数的局部最小值。一般地线搜索算法如下：

其中，第三步找到一个步长 $a_{k} >0$ , 使得 $f(x_{k}+a_{k}p_{k})f(xk+akpk)<f(xk)$

$a_{k} = \underset {a_{k} >0} {argmin} f(x_{k}+a_{k}p_{k}) \tag{2.1}$

在梯度下降算法中，上式中的下降方向就是梯度的反方向（具体见第一部分），即 $p_{k} = -\nabla f(x)$ ,为了与第一部分保持符号统一，上式中的步长 $a_{k}$ ，用t替换，得到梯度下降算法中的精确线搜索在每次迭代中沿梯度方向的步长t，

$\underset {t >0} {argmin} f(x-t \nabla f(x)) \tag{2.2}$

梯度下降算法中的精确线搜索如下图所示，

精确线搜索实际用得比较少

设 $\nabla f(x))$ （即当方向确定时，变成了关于步长t的函数）,上式就是求g(t)的关于t的最小值。在梯度下降算法求f(x)的最小值过程中用到了精确线搜索来计算步长，而精确线搜索需要求g(t)的最小值。所以只有当单变量的最小化问题的计算成本比计算搜索方向的成本低时，才使用精确线搜索。因此，在实际应用中，用得比较多的是回溯线搜索。

2.2 回溯线搜索（Backtracking line search，BLS）

在介绍回溯线搜索之前，先介绍Wolfe conditions和 Goldstein conditions。

2.2.1 步长约束条件
在计算步长 $a_{k}$ 时,我们面临一个权衡：我们既想选择一个 $a_{k}$ 使得目标函数f大幅减小，但同时我们又不想花太多时间来选择 $a_{k}$ 。通俗的说就是存在一个矛盾：既想通过选择更多的 $a_{k}$ 来找到一个 $a_{k}$ 使得目标函数f大幅减小，但是选择的次数太多又会影响效率。一个理想的选择是全局最小化单变量函数 $\phi(.)$ ,其定义如下：

$\phi(a) = f(x_{k}+a p_{k}), \quad a>0, \tag{2.3}$

但是，求式2.3的全局最小耗费的计算成本太高。更实际的做法是使用不精确线搜索来确定一个步长使得目标函数以最小的代价取得足够的减小。

我们可以对 $a_{k}$ 加一个简单的条件，即要求f减小： $f(x_{k}+a_{k} p_{k}) < f(x_{k})$ 。但这个条件并不足够使函数收敛。因此，我们需要一个足够减小（sufficient decrease condition）的条件。

根据泰勒展开，

$f(x_{k}+a_{k} p_{k}) = f(x_{k}) + a_{k} p_{k}^{T} \nabla f(x_{k} +t a_{k} p_{k}) \tag{2.4}$

从 $x_{k}$ 到下一个迭代 $x_{k+1}:=x_{k}+a_{k} p_{k}$ ,f减少得足够多。也就是式2.4中的 $a_{k} p_{k}^{T} \nabla f(x_{k} +t a_{k} p_{k})$ 项是足够大的负数。观察易知， $a_{k} p_{k}^{T} \nabla f(x_{k} +t a_{k} p_{k})$ 正比于 $a_{k}$ 和 $p_{k}^{T} \nabla f(x_{k} +t a_{k} p_{k})$ 。同时，我们希望 $p_{k}^{T} \nabla f(x_{k} +t a_{k} p_{k})$ 与 $p_{k}^{T} \nabla f(x_{k})$ 相差不大，但我们又不能保证这点。因此，我们通过一个较小的参数 $0 < c 1 < 1 0 （通常 c 1 = 1 0 − 4 c_{1}= 10^{-4} ）来放宽这个假设，即$

$p_{k}^{T} \nabla f(x_{k} +t a_{k} p_{k}) \leq c_{1} p_{k}^{T} \nabla f(x_{k})\tag{2.5}$

也就是说，目标函数f减少的幅度至少是 $p_{k}^{T} \nabla f(x_{k})$ 的一部分，根据下降方向假设， $p_{k}^{T} \nabla f(x_{k})$ 是负的。

2.2.2 Armijo condition

结合式2.4和式2.5，步长 $a_{k}$ 要使目标函数f足够减小，可通过下面不等式衡量：
$f(x_{k}+a p_{k}) \leq f(x_{k}) +c_{1} a \nabla f_{k}^{T} p_{k} \tag{2.6}$

其中， $c_{1} \in (0,1)$ 。换而言之，f的减少应该同时正比于步长 $a$ 和方向导数 $\nabla f_{k}^{T} p_{k}$ 。式2.6称为Armijo condition。式2.6的左边就是 $\phi(a) = f(x_{k}+a p_{k})$ ,右边记作 $=f(x_{k}) +c_{1} a \nabla f_{k}^{T} p_{k}$ 。足够减小的条件如下图所示，

上图中， $l (a)$ 的斜率是负数 $c_{1} \nabla f_{k}^{T} p_{k}$ ，但是因为 $c_{1} \in (0,1)$ ，所以 $l (a)$ 是略微向下倾斜但比较平缓的直线，对于比较小的正数 $a$ 来说,虚线 $l (a)$ 在实线 $\phi(a)$ 之上。显然高于虚线 $l (a)$ 的部分不存在极小值。根据 $l (a)$ 和 $\phi(a)$ 的大小，把 $a$ 分为可接受部分和不可接受部分。足够减小条件表明：当且仅当 $\geq\phi(a)$ 时，a是可接受的。在实际应用中， $c_{1}$ 通常选得比较小， $c_{1}= 10^{-4}$ ，即 $l (a)$ 比较平缓。

2.2.3 curvature condition

Armijo condition约束太简单了，以至于任意小的步长 $a$ 都可以满足该条件。如果只是约束了f下降了足够多，我每次都移动很小的步长，这不可能得到最优解。为了排除不可接受的比较短的步长，我们进一步引入曲率条件（curvature condition）。

$f(x_{k}+a p_{k})$ 与 $f(x_{k})$ 之间的减少量：

$f(x_{k}+a p_{k})-f(x_{k}) =a p_{k}^{T} \nabla f(x_{k} +t a p_{k}) \tag{2.7}$

如果步长 $a$ 比较小，则 $p_{k}^{T} \nabla f(x_{k} +a p_{k})$ 与 $p_{k}^{T} \nabla f(x_{k})$ 比较接近，同理， $p_{k}^{T} \nabla f(x_{k} +ta p_{k})$ 也会接近 $p_{k}^{T} \nabla f(x_{k})$ 。这不是我们想要的，因此我们设置 $c_{1} < c_{2} <1$ (通常 $c_{2} =0.9$ ) ,满足：

$p_{k}^{T} \nabla f(x_{k} +a p_{k}) \geq c_{2} p_{k}^{T} \nabla f(x_{k}) \tag{2.8}$

上式表示 $p_{k}^{T} \nabla f(x_{k} +a p_{k})$ 与 $p_{k}^{T} \nabla f(x_{k})$ 之间存在一个固定部分的差异。满足上式约束的条件称为曲率条件。

对于 $c_{2} \in (c_{1},1)$ ,其中 $c_{1}$ 来自式2.6。式2.8左边是 $\phi(a_{k})$ 的导数，即切线斜率，所以曲率条件确保 $\phi$ 在 $a_{k}$ 处的斜率大于 $c_{2}$ 乘以起始点斜率 $\phi^{'}(0)$ 。这是说得通的，因为如果 $\phi^{'}(\alpha)$ 的斜率是负的且较陡，表明沿着所选方向继续移动，f能够大幅减小，在这里停止就错失了快速收敛的机会。相反，如果 $\phi^{'}(\alpha_{k})$ 仅仅是微小的负斜率或者甚至是正斜率，即下降比较平缓或出现开始增大附近，出现极小值的概率增大，表明在这个方向f不可能有更多的减小，因此终止搜索是合理的。曲率条件如下图所示，

其中， $c_{2}$ 一般取0.9（对于牛顿法和拟牛顿法）或0.1（对于非线性共轭梯度法）。从上图可以看出，desired slope比tangent要小一些，即没那么陡，这是因为desired slope= $c_{2}$ *tangent；而desired slope比Armijo condition中的 $l (a)$ 要陡一些，因为 $l (a)$ 的斜率等于 $c_{1}$ *tangent，而 $c_{2}$ *tangent > $c_{1}$ *tangent。

2.2.4 Wolfe conditions

把足够减小条件（Armijo condition）和曲率条件两个条件结合起来就是Wolfe conditions。把上面两个条件结合如下：

$f(x_{k}+a p_{k}) \leq f(x_{k}) +c_{1} a \nabla f_{k}^{T} p_{k} \tag{2.9a}$

$p_{k}^{T} \nabla f(x_{k} +a p_{k}) \geq c_{2} p_{k}^{T} \nabla f(x_{k}) \tag{2.9b}$

其中，

Wolfe conditions如下图所示：

从上图可以看出，Wolfe条件既保证了步长 $a$ 使函数f取得足够的减少，又确保步长不会太短。

不难证明，对于平滑且有下界的任何函数f，总存在步长满足Wolfe conditions，具体参考《numerical optimization》Lemma3.1的证明。Wolfe conditions可被用于大部分的线搜索方法中，特别是在实现拟牛顿法时。

2.2.5 Goldstein conditions

类似Wolfe 条件，Goldstein 条件既确保步长 $a$ 使函数f取得足够的减少但又不会太短。Goldstein条件同样使用一对不等式来表示，

$f(x_{k})+(1-c) a_{k} \nabla f_{k}^{T} p_{k}\leq f(x_{k}+a_{k} p_{k}) \leq f(x_{k}) +c a_{k} \nabla f_{k}^{T} p_{k} \tag{2.10}$

其中， $。上式中的第二个不等式是足够减小条件（式2.6）,而引入第一个不等式来控制步长，如下图所示：$

从上图中可以看出，同Wolfe 条件相比，Goldstein 条件的一个缺点是式3.10的第一个等式可能避开了所有的最小值。然而Goldstein conditions和Wolfe conditions有很多的共同之处，及两者的收敛理论也很相似。Goldstein通常用于牛顿型方法，而不太适合拟牛顿方法。

2.2.6 回溯线搜索

回溯线搜索属于不精确线搜索，迭代过程中目标函数满足Armijo-Goldstein条件即可，Armijo-Goldstein条件是用来找一个合适的步长，使得目标函数 $f(x_{k})$ 减少得足够多。Armijo-Goldstein条件如下：

$\Delta x) >f(x) + \alpha t \nabla f(x)^{T} \Delta x$

其中,更新步长 $\beta t$ ,参数 0 < $\alpha$ <0.5， 0 < $\beta$ <1 。步长t从t=1开始更新，然后通过 $\beta$ 来减小t直到满足停止条件 $\Delta x) \leq f(x) + \alpha t \nabla f(x)^{T} \Delta x$ ,因此称为回溯。因为 $\Delta x$ 是下降方向，我们有 $\nabla f(x)^{T} \Delta x <0$ ，因此，对于t足够小时，有，

$\Delta x) \approx f(x) + t\nabla f(x)^{T} \Delta x f(x+tΔx)≈f(x)+t∇f(x)TΔx<f(x)+αt∇f(x)TΔx$

上式表明回溯线搜索最终会停止搜索。回溯的条件如下图所示，

从图中可以看出，当t在区间（0， $t_{0}$ ]时，回溯退出，不等式 $\Delta x) \leq f(x) + \alpha t \nabla f(x)^{T} \Delta x$ 成立，即 $\leq t_{0}$ 时，停止回溯。回溯线搜索会终止，当步长t满足：

$\quad or \quad t \in (\beta t_{0}, t_{0}]$

当步长t=1满足回溯条件时，如 $\leq t_{0}$ ,上述第一种情况会发生。特别地，我们可以通过回溯线搜索获得步长，当满足，

$\geq min\{1, \beta t_{0} \}$

一般情况下，参数 $\alpha$ 的取值范围在0.01到0.3之间，表示我们接受目标函数减少的预测范围在1%到30%之间。参数 $\beta$ 取值范围在0.1到0.8之间。0.1对应非常粗略的搜索，0.8对应没那么粗略的搜索。

总之，回溯线搜索通过$t = \beta t $自适应地更新步长，从步长t=1开始， $\beta$ ， ${\beta}^{2}$ ,…从大到小不断地缩小搜索步长，直到 $\leq t_{0}$ ，停止回溯。

回溯线搜索算法如下图：

本文到此就结束了，本人水平有限，难免有纰漏，欢迎指出。一个比较大的瑕疵就是：本文符号使用没有统一，增加了阅读苦难。

最后挖个坑，后面有时间整理信赖域（Trust Region）相关内容。

Reference：
1.Stephen Boyd&Lieven Vandenberghe《Convex optimization》
2.Jorge Nocedal&Stephen J. Wright《numerical optimization》
3.https://www.cs.cmu.edu/~ggordon/10725-F12/slides/05-gd-revisited.pdf
4.https://people.cs.umass.edu/~barna/2015-BigData/conv2.pdf
5.https://web.stanford.edu/class/ee364a/lectures/unconstrained.pdf
6.https://en.wikipedia.org/wiki/Line_search
7.https://en.wikipedia.org/wiki/Backtracking_line_search
2/slides/05-gd-revisited.pdf
4.https://people.cs.umass.edu/~barna/2015-BigData/conv2.pdf
5.https://web.stanford.edu/class/ee364a/lectures/unconstrained.pdf
6.https://en.wikipedia.org/wiki/Line_search
7.https://en.wikipedia.org/wiki/Backtracking_line_search
8.https://optimization.cbe.cornell.edu/index.php?title=Line_search_methods

SQL Server 中的 GO 及其与其他数据库的对比杨云龙UP 三大数据库学习数据库 sqlserver sql Oracle oracle MySQL mysql
在SQLServer中，GO不是SQL语言的一部分，而是一个批处理分隔符，用于分隔脚本中的多个SQL语句或执行块。它由SQLServerManagementStudio(SSMS)等工具处理，用来指示执行一个批次的SQL语句。1、SQLServer中的GO作用分隔批次（处理多批次脚本）：将SQL脚本中的语句分成多个批次执行。每个GO表示一个独立的执行块。例如，在某些操作中，创建表的语句可能依赖于先
SQLSERVER 中GO的作用 weixin_30278311 数据库
go向SQLServer实用工具发出一批Transact-SQL语句结束的信号。go是把t-sql语句分批次执行。（一步成功了才会执行下一步,即一步一个go）BEGIN和END语句用于将多个Transact-SQL语句组合为一个逻辑块。在控制流语句必须执行包含两条或多条Transact-SQL语句的语句块的任何地方，都可以使用BEGIN和END语句。转载于:https://www.cnblogs.
NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解汀、人工智能 LLM工业级落地实践人工智能 LLM 自然语言处理 NL2SQL 大模型应用 Text2SQL gpt
NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理1.MindSQL(库)MindSQL是一
【微信小程序】富文本rich-text的图片预览效果的几种方法 Lana学习中微信小程序微信小程序小程序
前言使用原生小程序开发，实现在富文本rich-text中的图片预览效果的几种方法对比。update:因为方案3wxparser后续没有再维护，解析微信公众号文章时会出现排版错误的问题。作为插件也很难二次开发。换成mp-html了1.正则+wx.previewImage（有明显不足）一个不需要用额外组件或插件的方法：思路：使用正则把图片的url进行剖离出来，push进一个数组中，点击富文本组件，运行
机器学习5——非参数估计平和男人杨争争山东大学机器学习期末复习机器学习概率论算法
非参数估计在参数估计中我们已经提到，想要估计后验概率P(ωi∣x)=p(x∣ωi)p(ωi)p(x)P\left(\omega_i\midx\right)=\frac{p\left(x\mid\omega_i\right)p\left(\omega_i\right)}{p(x)}P(ωi∣x)=p(x)p(x∣ωi)p(ωi)，就需要估计类条件概率p(x∣ωi)p\left(x\mid\omega
SQLSERVER 中GO的作用详解
为了省事，直接贴过来的。请看下文详解。usedb_CSharpgoselect*,备注=casewhenGrade>=90then'成绩优秀'whenGrade=80then'成绩良好'whenGrade=70then'成绩及格'else'不及格'endfromtb_Grade如果只是执行一条语句，有没有GO都一样如果多条语句之间用GO分隔开就不一样了每个被GO分隔的语句都是一个单独的事务，一个语
工厂模式中使用Map管理策略实例时，为何仍需要Context？
看这篇文章前，可以先了解一下：策略模式与工厂模式的黄金组合：从设计到实战一、核心矛盾：创建职责与调用职责的分离问题当使用Map管理策略实例时（如MapstrategyMap），工厂确实能高效获取策略实例，但这仅解决了**“策略从哪里来"的问题。而策略的"如何使用”**仍面临以下挑战：上下文逻辑碎片化：策略调用前后的公共逻辑（如参数校验、结果处理）会散落在客户端代码中调用流程不一致：不同客户端可能以
8、做中学 | 四年级下期 Golang运算符
运算符：在程序中扮演执行数学、逻辑运算的过程一、算术运算符数学运算使用到的运算符运算符描述实例+相加A+B输出结果30-相减A-B输出结果-10*相乘A*B输出结果200/相除B/A输出结果2%求余B%A输出结果0++自增A++输出结果11–自减A--输出结果9//运算符varaint=10varbint=20varcint//+运算c=a+bfmt.Println("c=",c)//30//-c
用Tensorflow进行线性回归和逻辑回归（十） lishaoan77 tensorflow 线性回归 tensorboard 可视化
用TensorBoard可视化线性回归模型TensorBoard是一种可视化工具，用于了解、调试和优化模型训练过程。它使用在执行程序时编写的摘要事件。上面定义的模型使用tf.summary.FileWriter来写日志到日志目录/tmp/lr-train.我们可以用命令调用日志目录的TensorBoard，见Example3-13(TensorBoard已黙认安装与TensorFlow一起).Ex
【MSSQL】sql server怎样整理某个表的碎片厦门德仔 MSSQL sqlserver 数据库服务器
SQLServer如何整理某个表的碎片在数据库的维护过程中，碎片化是一个常见的问题。随着数据的插入、更新和删除，SQLServer中的表和索引可能会出现碎片，这会导致查询性能下降。本文将介绍如何在SQLServer中整理某个表的碎片，并提供代码示例帮助你理解。什么是碎片化？碎片化是指数据在物理存储上不连续，导致数据库无法有效利用存储空间。碎片化通常分为两种类型：内部碎片：数据页中存在空闲空间，没有
embedding模型有哪些？如何选择合适的embedding模型？行云流水AI笔记 embedding
embedding模型是一种将数据映射到低维空间的模型，常用于自然语言处理、推荐系统、图像识别等领域。以下是一些常见的embedding模型：Word2Vec：CBOW（ContinuousBag-of-Words）：通过上下文预测中心词。Skip-Gram：通过中心词预测上下文。GloVe（GlobalVectorsforWordRepresentation）：结合了词频统计和Word2Vec的
【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
print(3 or 5)的结果是什么？为什么？ Lauren_Lu python
print(3or5)的结果是：3原因：在Python中，or是一个逻辑运算符，但当它作用于非布尔类型（比如整数）时，它的行为是：返回第一个为真的值；如果第一个值为假，则返回第二个值。具体分析：3是一个非零整数，在布尔上下文中被视为True所以3or5就是：如果3是True，就返回3；否则返回5由于3是True，所以返回的是3。类似例子：print(0or5)#输出5，因为0被视为Falsepri
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
BTC官网关注巨鲸12亿美元平仓，XBIT去中心化交易平台表现稳定
在全球加密货币市场波动加剧的背景下，2025年5月25日传出重磅消息。据今日最新国际报道，知名巨鲸JamesWynn完全平仓价值12亿美元的BTC多头仓位，整体盈利约845万美元，此举引发市场广泛关注。与此同时，收益型稳定币市场迎来爆发式增长，去中心化交易所平台在市场动荡中展现出卓越的稳定性和抗风险能力。巨鲸大举平仓，市场信号值得关注今日中午，币界网监控显示，加密货币市场出现重要变化。知名巨鲸投资
HarmonyOS Next IM实战：数据库查询慢的优化过程分享
HarmonyOSNextIM实战：数据库查询慢的优化过程分享1、背景介绍在IMSDK开发中，客户端要使用关系型数据库存储会话、用户、消息等数据，最开始做C端应用一直没发现问题，今年开始有B端用户使用时反馈应用卡，消息延迟等，经过定位发现是B端用户的会话和消息更多，在数据库查询时更慢，由于之前都在主线程所以导致应用卡和慢。本文分享整个优化过程中的遇到问题、解决思路，最终效果等。2、HarmonyO
微信小程序开发中的触摸手势和页面缩放无敌暴龙战士- 微信小程序 notepad++小程序
微信小程序开发中的触摸手势和页面缩放内容是非常重要的功能之一，它可以帮助提高用户体验，增强交互性。在本篇文章中，我将详细介绍微信小程序中触摸手势的使用方法和页面缩放内容的实现。一、触摸手势触摸手势是指用户在屏幕上进行触摸操作时产生的动作，如点击、滑动、长按等。微信小程序提供了一些接口来处理触摸手势，包括触摸事件、手势事件等。触摸事件微信小程序中的触摸事件主要有以下几种：touchstart：手指触
麒麟系统使用-运用VSCode运行.NET工程 mystonelxj 麒麟系统 vscode .net ide 麒麟
文章目录前言一、VSCode安装与配置1.工具安装2.扩展安装3.环境配置二、运行相关工程1.基础设置2.设置并运行mytest工程（控制台演示工程）3.设置并运行mywebtest工程（网页演示工程）总结前言在麒麟系统使用-进行.NET开发一文中我们介绍了如何在麒麟系统系统创建.NET工程，本文将进一步介绍如何使用微软提供的IDE工具VSCode来运行相应的工程。一、VSCode安装与配置1.工
uniapp vue3版本的一些小细节！养乐多～ch uni uni-app vue.js 前端
1,生命周期的引用import{onShow,onHide,onLoad}from"@dcloudio/uni-app"onShow(()=>{showLog('onShow')})onLoad((options)=>{showLog('onLoad')})需要引入，才可以调用2，全局引入css在main.js或者ts中，导入就可以//例如引入全局CSS文件import'./util/baseCs
中国地图分幅编号计算工具红衣大叔 gis javascript 分幅
fenfu中国地图分幅编号计算工具，符合GB/T13989-2012国家标准。支持单点计算和范围查询，适用于测绘、GIS开发、城市规划等场景。特性✅支持8种比例尺（100万至5000）✅单点坐标转图幅编号✅矩形范围批量图幅查询✅自动处理高纬度特殊分幅规则✅输入验证与错误处理✅TypeScript类型支持安装npminstallfenfu#或yarnaddfenfu使用示例1.单点计算constMa
第06章_java常用类假装不痛 java java jvm 开发语言
6.java常用类6.1String类publicclassMain{/*1.概述1.1String:字符串，使用一对""引起来表示1.2String是声明为final的，不可被继承1.3String实现了Serializable接口：表示字符串是支持序列化的实现了Comparable接口：表示String可以比较大小1.4String内部定义了finalchar[]value用于存储字符串数据(
亚马逊云科技助力全球电子发票合规化进程 taibaili2023 AWS
亚马逊云科技助力全球电子发票合规化进程关键字:[亚马逊云科技，Peppol，电子发票合规化，全球电子发票，税务合规，发票管理，增值税申报]导读在这场演讲中，演讲者分享了亚马逊云科技如何助力全球电子发票合规化进程。他解释了电子发票的重要性，以及各国政府为何推行电子发票系统。他介绍了电子发票的发展趋势，包括监管模式、持续交易控制模式、标准化格式等。他还分享了亚马逊云科技与经典发票员的合作，利用云服务提
浏览器移动端html右边有一点白_手机端页面在项目中遇到的一些问题及解决办法... weixin_39804335
1.解决页面使用overflow:scroll在iOS上滑动卡顿的问题?首先你可能会给页面的html和body增加了height:100%,然后就可能造成IOS上页面滑动的卡顿问题。解决方案是：(1)看是否能把body和html的height:100%去除掉。(2)在滚动的容器中增加：-webkit-overflow-scrolling:touch或者给body增加：body{overflow-x
java课程设计体会_Java课程设计（阶段一） XY LIU java课程设计体会
1选题选题一算术运算测试题目要求实现十道100以内加减法数学题，能根据题目计算出答案，与输入答案对比，判断做题是否正确，最后计算分数。添加排行榜功能存放到文件或数据库中。使用Java知识String类IO：Reader、Writer类集合：ArrayLiastsort()方法选题二猜数游戏题目要求计算机产生随机数，猜中即胜，猜不中，提示是大了还是小了，继续猜，直至猜到，给出所用时间和评语。保留用户
java项目打包_Java项目打包方式分析 weixin_39727402 java项目打包
概述在项目实践过程中，有个需求需要做一个引擎能执行指定jar包的指定main方法。起初我们以一个简单的spring-boot项目进行测试，使用spring-boot-maven-plugin进行打包，使用java-cpdemo.jar.执行，结果报错找不到对应的类。我分析了spring-boot-maven-plugin打包的结构，又回头复习了java原生jar命令打包的结果，以及其他Maven打
Python代理池的构建与应用：实现高效爬虫与防封禁策略程序员威哥 python 爬虫开发语言
在进行大规模网络数据抓取时，IP封禁是最常见的反爬虫手段之一。为了应对这一挑战，代理池成为了一个重要工具。通过构建代理池，爬虫程序可以随机切换代理IP，避免同一IP被频繁访问而导致封禁，确保数据抓取任务的稳定性和持续性。本文将详细介绍如何使用Python构建一个高效的代理池，并结合实际应用场景，讲解如何使用代理池提升爬虫的抓取能力和防封禁策略。一、代理池的工作原理代理池的基本工作原理是，爬虫请求时
Python爬虫实战：用Tushare和Baostock爬取股票历史数据及K线图与技术指标计算
在金融数据分析和量化交易中，股票历史数据的获取是进行技术分析、回测和策略研究的第一步。传统上，投资者需要依赖付费数据服务，然而如今，借助Python强大的爬虫工具和开源数据接口，我们能够轻松地爬取免费的历史股票数据，并结合K线图与技术指标来进行深入分析。Tushare和Baostock是两个非常流行的开源金融数据接口。Tushare提供了丰富的国内外金融数据，特别是A股市场的历史数据和实时数据，而
2024年AI 智能助手（大模型）产品市场分析｜商派徐礼昭｜商派软件市场负责人人工智能
一、引言人工智能的浪潮不断向前推进，智能助手作为其中的重要应用，已经逐渐渗透到我们生活的各个方面。它们以其便捷性和个性化的特点，改变了我们与世界的互动方式。本报告将对AI智能助手进行全面的行业分析，包括行业概况、主要玩家、用户数据、发展要素以及未来趋势等方面，并通过具体案例分享，帮助读者深入了解这一领域的现状和未来发展潜力。二、行业概览（一）智能助手的定义和发展阶段智能助手是利用人工智能技术为用户
C# 与串口通信：解决常见问题的调试技巧与实用建议威哥说编程 c#单片机 stm32
串口通信作为一种经典的通信方式，在很多领域中仍然广泛应用，尤其是在嵌入式系统、工业自动化、测控系统等场景中。通过串口接口，可以实现设备间的短距离、低速数据传输。C#提供了强大的System.IO.Ports.SerialPort类来支持串口通信的开发，但在实际开发中，开发者常常遇到一些问题，比如数据丢失、串口冲突、波特率不匹配等。本文将深入探讨如何使用C#进行串口通信，结合调试技巧和实用建议，帮助
由数据泄露引发业务崩塌的HTTP代理危险彬彬醤 http 网络协议网络 tcp/ip web安全大数据 macos
HTTP代理作为跨地域访问的常用工具，被广泛应用于跨境电商、数据采集、内容访问等场景。然而，其明文传输特性与监管漏洞，正成为数据安全与业务稳定的隐形杀手。某跨境电商团队因使用廉价HTTP代理，导致500+账号被亚马逊封禁；某企业员工通过公共代理访问内部系统，引发数据泄露事故——这些案例揭示：不当使用HTTP代理，可能让便捷变成灾难。五大核心风险解析1.不安全的数据传输传统HTTP代理工作于OSI模
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

凸优化： 梯度下降、回溯线搜索（Backtracking line search）