运筹OR帷幄

优化｜如何减小噪声和误差对梯度下降法的影响

编者按：

许多精确算法在理论上能保证我们的目标函数值一直下降。在随机梯度下降以及无导数优化等情况下，目标移动方向受到噪声干扰，与实际下降方向往往会存在偏差。本文将分析噪声和下降偏差对于梯度下降法等算法的影响，并且介绍常用的改进方法。

应用背景

通常意义下，我们考虑的优化问题可写成
$\begin{equation}\nonumber \min \phi(x), \quad \text{s.t.} c_i(x)\geq0, i\in I. \end{equation}$

我们会对 $\phi$ 和 $c_i (i\in I)$ 的性质做出一些假设 (例如函数是凸的、Lipschitz连续的), 然后在这些假设的基础上，构造具有一定收敛性的优化算法。这些收敛性结果需要一个共同的前提：对于任意的 $x\in\mathbb{R}^n$ , 我们都能获得 $\phi(x)$ 和 $c_i(x)$ 的精确值。如果算法中涉及 (高阶) 导数的计算，那我们也假设这些导数都能够被精确算出。

然而在实际问题中，这个前提未必成立。其中一个原因在于有些优化问题涉及大量的样本，而所求的函数值被表示为不同样本对应值的平均。对于这类问题，许多随机算法应运而生，目前已有较为成熟的理论和系统的应用。这里不再赘述。在本文中，我们主要考虑另一类问题——自变量的规模不一定很大，但问题不满足上述精确性假设。

其中一个例子是阻尼器的分配 $^{[1]}$ 。为了减小地震带来的经济损失，我们会在两栋相邻的建筑物之间安置阻尼器，使得建筑物具有更稳定的结构。然而阻尼器的成本较高，因此我们需要建立相应的优化问题，在尽可能少的阻尼器之下获得尽可能大的减震效果。这类优化问题的目标函数是通过地震模拟器产生的一个数值积分。由于它具有积分的形式，我们有理由认为它是可微的；但又由于它是一个黑箱函数，我们无法直接得到梯度的精确值。

类似的实际问题还有很多 $^{[2]-[4]}$ ，而这些问题大致可以分为两类。第一类可分为两种情况：(1) 函数本身不可微；(2) 由于问题的实际背景，我们无法得到可靠的近似梯度 (当然，我们可以通过差分等方式得到梯度的近似值；但如果我们在数值算法中使用这些近似值，无法得到理想的实验结果)。这类问题的求解往往需要无导数算法。在另一类问题中，函数值和导数值都可能具有一定的计算误差，但误差的大小是我们可以估计甚至控制的。对于这类问题，我们可以通过改进原有的优化算法，在新的情境下建立收敛结果。我们接下来介绍几个相应的例子。若不加说明，我们默认下文中出现的 $\|\cdot\|$ 表示2-范数。

在噪声下的BFGS算法 $^{[5]}$

考虑无约束的优化问题 $\min_{x\in\mathbb{R}^{n}} \phi(x),$

其中 $\phi {\in} C^{1}(\mathbb{R}^n)$ , 但函数与梯度值无法直接计算。对应地，我们可以获得它们的近似值 $f$ 和 $g$ :
$\begin{equation}\nonumber f(x)=\phi(x)+\varepsilon(x), \quad g(x)=\nabla \phi(x)+e(x), \end{equation}$

对于上述问题，我们可以改进BFGS算法，它对于L-smooth的强凸函数具有全局收敛的结论。证明中的一个重要部分是对于线搜索的分析。对于噪声下的更新方向 $p_k =−H_kg(x_k)$ , 我们寻找步长 $\alpha$ 满足
$\begin{equation}\nonumber f(x_k + αp_k) ≤ f(x_k) + c_1α p^T_k g(x_k), \quad p^T_k g(x_k + α p_k) ≥ c_2p ^T_k g(x_k).\quad \quad \quad \end{equation}$

其中 $c_1,c_2$ 是给定参数。如果没有噪声，这样的 $\alpha$ 是一定存在的。我们在用 $f$ 和 $g$ 替换 $\phi$ 和 $\nabla\phi$ 之后，需要重新分析步长 $\alpha$ 是否存在 (在必要的时候，可以调整线搜索准则)。可以证明，当 $\|\nabla\phi(x_k)\|$ 足够大时，我们可以找到满足上述条件的步长 $\alpha$ , 而且它在特定的线搜索参数 $c_1', c_2'$ 之下满足精确值对应的线搜索准则，即
$\begin{equation} \nonumber \phi(x_k + αp_k) ≤ \phi(x_k) + c_1'α p^T_k \nabla\phi(x_k), \quad p^T_k \nabla\phi(x_k + α p_k) ≥ c_2'p ^T_k \nabla\phi(x_k). \end{equation}$
总之，这样的线搜索是良定义的，且步长满足原先(无噪声)步长的一些特性。结合改进算法的性质和误差的特点，我们最终可以得到以下收敛性结论：

**定理1：**假设 $\phi$ 是有下界且二次连续可微的强凸函数，其梯度满足lipschitz条件 $\|\nabla\phi(x)-\nabla\phi(y)\|\leq{M}\|x-y\|, \forall x,y\in\mathbb{R}^n$

计算误差始终满足 $|\varepsilon(x)|\leq\epsilon_f$ 和 $\|g(x)\|\leq\epsilon_g$ ； $c_1,c_2$ 是线搜索中用到的参数； $\beta_1\in(0,1)$ 是事先取定的参数。根据 [5] 中的改进算法，我们可以证明 ${x_k\}$ 以线性收敛的速度趋向于最优解邻域

$\begin{equation}\nonumber \mathcal{N}_1 = \left\{x\mid \|∇φ(x)\| ≤ \max \left\{A\sqrt{\frac{M\epsilon_f}{β_1}} , \frac{B\epsilon_g}{β_1} \right\}\right\}, \end{equation}$

其中 $\max \left\{ \frac{16\sqrt{2}}{ \sqrt{(c_2 − c_1)(4 − c_1 − 3c_2)}} , \frac{8}{\sqrt{c_1(1 − c_2)}} \right\}$ , $\max \left\{\frac{8}{1 − c_2}, \frac{8(1 + c_1)}{c_2 − c_1} + 6 \right\}$ .

可以看出，当误差 $\epsilon_f = \epsilon_g=0$ 时，对应有 $\mathcal{N}_1 = \{x^{*}\}$ 。此时定理1与BFGS算法目前在精确性假设下的最好收敛性结论对应。更进一步，我们还可以证明：

定理2：沿用定理1中的条件和算法设置。设
$\begin{equation}\nonumber \hat{\phi}=\max_{x\in\mathcal{N}_1}\phi(x),\quad \mathcal{N}_2 = \{x|\phi(x)\leq\hat{\phi}+2\epsilon_f\}. \end{equation}$

可证明，对任意的 $k>K=\min\{k\in\mathbb{N}|x_k\in\mathcal{N}_1\}$ ， $x_k$ 都在最优解邻域 $\mathcal{N}_2$ 中。

可控制误差下的改进算法

与噪声不同，我们考虑另一类问题，其中函数值与梯度值的误差可以被控制。例如问题 $\min_{x\in\mathbb{R}^{n}} \phi(x)=\int_{t\in\Omega}h(x,t)dt,$

其中 $h$ 连续可微， $\Omega=[a,b]^{n}$ , a $\phi$

一个简单的例子是对梯度法的改进。原先的线搜索准则可写为
$\begin{equation}\nonumber \phi(x_k-\alpha\nabla\phi_k)\leq\phi_k-\sigma\alpha{\|\nabla\phi_k\|}^2, \end{equation}$

其中 $\sigma\in(0,1)$ 是给定的参数。根据Taylor一阶展开，我们知道这样的步长存在。然而对于 $f_k=\phi_k+\varepsilon(x_k)$ 和$ g_k=\nabla\phi_k+e(x_k) $, 我们无法得到$ f(x_k-h{g}_k)\leq{f}_k-h|g_k|^2+O(h2) $) 的性质。因此，我们考虑一个新的线搜索准则：$ $f(x_k-\alpha{g}_k)\leq {f}_k-\sigma\alpha{\|g_k\|}^2+\xi_k,$ $

其中 $\xi_k\geq|\epsilon(x_k-\alpha{g}_k)|+|\epsilon(x_k)|$ 。如果不等式取">"，显然线搜索是良定义的；如果我们在计算时保证 $\|e(x_k)\|<\omega\|g_k\|$ ，其中 $\omega<1$ , 则可知 $\begin{equation}\nonumber \phi(x_k-h{g}_k)\leq{\phi}_k-hg_k^T\nabla\phi_k+O(h^2)\leq{\phi}_k-h(1-\omega)\|g_k\|^2+O(h^2). \end{equation}$

此时 $g_k$ 是一个下降方向，因此我们可以选择 $\sigma<1-\omega$ , 并取 $\xi_k =|\epsilon(x_k-\alpha{g}_k)|+|\epsilon(x_k)|$ 。为了进一步建立收敛性结论，**我们通常需要控制计算中的误差，来保证 $\sum\xi_k<\infty$ 。**实际上对于满足精确性假设的问题，也曾出现过类似的做法 $^{[6]}$ (在线搜索中引入 $\xi_k$ 项并要求 $\sum\xi_k<\infty$ )。

梯度法是一个很特殊的例子。包括梯度法在内，很多方法在精确性假设下计算出的更新方向 $d_k$ 是 $\phi$ 的下降方向。然而对于其中的一部分算法， $d_k$ 的计算涉及到历史梯度值 ( $g_{k-1}, g_{k-2}\cdots$ )。此时我们很难给出一个误差的限值标准，使得按标准计算的 $\{f_i\}_{i\leq{k}}$ 和 $\{g_i\}_{i\leq{k}}$ 能够生成一个 $\phi$ 的下降方向。尽管如此，我们仍然可以刻画算法的收敛性结果。一个常见的思路是考虑凸函数，通过 $\|\nabla\phi(x)\|=0$ 来说明算法到达函数的极小值。

为了建立算法的收敛性结果，我们需要对误差的大小做出要求。这里我们介绍一种常见的设置 $^{[7][8]}$ 。假设 $\phi$ 是 $\mathbb{R}^n$ 上L-smooth的凸函数，即满足条件：
$\phi(x) − \phi(y) +\left<∇\phi (y), x − y\right> ≤ \frac{M}{2}\|x − y\|^2, \quad \forall x,y\in\mathbb{R}^{n},$

其中 $M > 0$ 是强凸参数。我们接下来给出一阶 $(\delta,L)$ 信息的定义。

定义1 对于 $\delta, L>0$ , 函数 $\phi$ 具备一阶 $(\delta,L)$ 信息，当且仅当对任意的 $y\in\mathbb{R}^n$ , 我们都能计算出一组 $(f (y), g (y))$ 满足 $\left ≤ L \|x − y\|^2 + δ, \quad \forall x ∈ \mathbb{R}^n.$

以上定义可拓展到定义在 $Q$ 上的函数，其中 $Q$ 是一个闭凸集。

假设对于**任意小的 $\delta>0$ **和足够大的 $L$ , 函数 $\phi$ 具有一阶 $(\delta,L)$ 信息。对于许多常见的一阶算法，我们可以适当选择 $\{\delta_k\}$ 和 ${L_k\}$ , 在第 $k$ 次迭代时按照一阶 $(\delta_k,L_k)$ 信息的标准来计算 $f_k,g_k)$ ，并用它代替 $(\phi_k,\nabla{\phi}_k)$ 。以梯度法 (Primal Gradient Method) 为例，它对应的收敛性结果 $^{[7]}$ 为 $\begin{equation}\nonumber \sum_{i=0}^{k-1}\frac{1}{L_i} [ \phi(x_{i+1}) − \phi(x^∗)] ≤ \frac{1}{2}\| x_0 − x^∗\|^2 \color{red}+\sum_{i=0}^{k-1}\frac{\delta_i}{L_i}. \end{equation}$

于 $\phi$ 是L-smooth的函数，我们可以认为 ${L_k\}$ 有上界，且 $M$ 是它的一个下界。而上式可改写为
$\begin{equation}\nonumber \min_{i=0,\cdots,k-1}\left\{\frac{1}{L_i} [\phi(x_{i+1}) − \phi(x^∗)]\right\} ≤ \frac{1}{2k}\| x_0 − x^∗\|^2 \color{red}+ \frac{1}{k} \sum_{i=0}^{k-1}\frac{\delta_i}{L_i}. \end{equation}$

因此如果 $\lim_{k\to\infty}\frac{1}{k}\sum_{i=0}^{k-1}\frac{\delta_i}{L_i}=0$ , 我们可推出 $\lim_{k\to\infty}\min_{i = 0, \cdots,k-1}\phi(x_{i+1})=\phi(x^*)$ , 即算法在 $x^*$ 处终止或存在子列趋近于唯一的最优解 $x^*$ 。其他的算法也有类似的收敛性结论，这里不再展开。

总结回顾

传统意义下，我们考虑的优化问题满足精确性假设，即目标 (约束) 函数和它的导数都可以被精确求出，然而在实际中许多问题并不满足这样的假设。对于具有大规模样本的问题，我们可以采用随机算法。在剩下的问题中，如果不能获得可靠的梯度信息，那么我们通常考虑无导数优化。如果我们能获得可靠的梯度信息，而函数值和梯度值伴随着可以估计大小的误差，那么我们考虑改进已有的一阶算法。面对具有误差的信息，一项重要的工作是制定合适的线搜索准则 (如果需要线搜索的话)，并验证它是良定义的。如果误差的大小只能估计而不能控制，我们希望在足够多次迭代之后，算法能够到达最优解的某个小邻域中；如果误差的大小可以控制，我们可以通过一阶 $(\delta,L)$ 信息等工具，给出误差的限制标准，并在这样的标准下得到算法全局收敛的结论。

[1] Audet, C., & Hare, W. (2017). Derivative-free and blackbox optimization.
[2] Booker, A. J., Dennis Jr, J. E., Frank, P. D., Serafini, D. B., Torczon, V., & Trosset, M. W. (1999). A Rigorous Framework by Surrogates for Optimization of Expensive Functions. Structural Optimization, 17, 1-13.
[3] Begin, T., Baynat, B., Sourd, F., & Brandwajn, A. (2010). A DFO technique to calibrate queueing models. Computers & Operations Research, 37(2), 273-281.
[4] Kannan, A., & Wild, S. M. (2012, June). Benefits of deeper analysis in simulation-based groundwater optimization problems. In Proceedings of the XIX International Conference on Computational Methods in Water Resources (CMWR 2012) (Vol. 4, No. 5, p. 10).
[5] Xie, Y., Byrd, R. H., & Nocedal, J. (2020). Analysis of the BFGS method with errors. SIAM Journal on Optimization, 30(1), 182-209.
[6] Han, S. P. (1977). A globally convergent method for nonlinear programming. Journal of optimization theory and applications, 22(3), 297-309.
[7] Devolder, O., Glineur, F., & Nesterov, Y. (2014). First-order methods of smooth convex optimization with inexact oracle. Mathematical Programming, 146, 37-75.
[8] Devolder, O. (2013). Exactness, inexactness and stochasticity in first-order methods for large-scale convex optimization (Doctoral dissertation, PhD thesis).

深度学习视频教程推荐 yunTrans Deep Learning 深度学习视频神经网络
推荐一个深度学习视频教程，中文，推导详细。老先生娓娓道来，将神经网络、深度学习讲的非常透彻。由复旦大学吴立德老师教授的课程：http://www.youku.com/playlist_show/id_21508721.html
基于深度学习的商品推荐 SEU-WYL 深度学习dnn 深度学习人工智能 dnn
基于深度学习的商品推荐系统利用深度学习技术对用户的行为和商品的特征进行分析和建模，从而向用户推荐最相关的商品。这类系统在电子商务、社交媒体和内容推荐等领域中具有广泛应用。以下是对这一领域的系统介绍：1.任务和目标商品推荐系统的主要任务和目标包括：个性化推荐：根据用户的兴趣和行为，向用户推荐个性化的商品列表。提高用户体验：通过精准推荐，提高用户的购物体验和满意度。增加销售额：通过推荐相关商品，增加用
常见的深度学习模型总结编码时空的诗意行者深度学习人工智能
1.深度前馈神经网络(DeepFeedforwardNetworks)发明时间：2006年左右，随着计算能力的提升和大数据集的可用性增加，深度学习开始兴起。发明动机：解决传统机器学习模型在复杂数据上的局限性，如线性模型无法处理非线性关系的数据。模型特点：由多个隐藏层组成的神经网络，每一层的节点与下一层的节点完全连接。应用场景：分类、回归、语音识别、图像识别等。2.卷积神经网络(Convolutio
深度学习视频推荐小赖同学啊人工智能深度学习音视频人工智能
以下为你呈现一个基于深度学习实现视频推荐的简化代码示例。这里我们使用的是协同过滤思想结合神经网络的方式，借助TensorFlow和Keras库来构建模型。在这个示例中，假设已有用户对视频的评分数据，目标是预测用户对未评分视频的评分，进而为用户推荐可能感兴趣的视频。1.环境准备要确保你已经安装了必要的库，如numpy、pandas、tensorflow等，可以使用以下命令进行安装：pipinstal
23、深度学习-自学之路-激活函数relu、tanh、sigmoid、softmax函数的正向传播和反向梯度。小宇爱深度学习-自学之路深度学习人工智能
在使用这个非线性激活函数的时候，其实我们重点还是学习的是他们的正向怎么传播，以及反向怎么传递的。如下图所示：第一：relu函数的正向传播函数是：当输入值（隐藏层）值大于了，就输出自己本身的值。反向梯度传播：当输出值大于0，那么反向梯度值就等于输出值乘以1如果小于0，那反向梯度值就等于0.通俗的来说就是，如果输入值是0或小于0，那么输出值的反向增强就没有。如果输入值大于0，那么输出值的方向增强就有。
自动驾驶技术的未来趋势与挑战分析智能计算研究中心其他
内容概要自动驾驶技术自诞生以来经历了多个发展阶段。最初的研究集中在感知和控制系统的基础构建，随后进入了数据处理和算法的优化阶段，如今，随着人工智能和机器学习技术的快速应用，自动驾驶行业正处于一个前所未有的迅猛发展期。当前，行业内涌现出多种解决方案，各大汽车制造商与科技公司纷纷加大投入，推动这一领域的技术进步。市场需求不断增加，为自动驾驶技术注入活力。城市交通拥堵、环境污染等问题促使人们寻求更加智能
基于深度学习的半导体检测与预测算法研究(二) 埃菲尔铁塔_CV算法深度学习人工智能神经网络 opencv 计算机视觉 python
摘要随着半导体行业的飞速发展，对生产过程中的检测和性能预测提出了更高要求。深度学习凭借其强大的数据处理和特征提取能力，在半导体领域展现出巨大的应用潜力。本文详细探讨了深度学习在半导体缺陷检测、工艺参数预测等方面的应用原理和方法，介绍了常见的深度学习模型如卷积神经网络（CNN）、循环神经网络（RNN）及其变体在半导体数据处理中的应用，分析了模型训练与优化的关键技术，并通过实际案例验证了深度学习算法在
基于深度学习的半导体算法原理及应用埃菲尔铁塔_CV算法算法机器学习人工智能计算机视觉深度学习 python
摘要随着半导体产业的持续发展，深度学习技术在该领域的应用日益广泛且深入。本文全面阐述了基于深度学习的半导体算法原理，涵盖卷积神经网络（CNN）、循环神经网络（RNN）及其变体长短时记忆网络（LSTM）和门控循环单元（GRU）等在半导体制造过程监测、缺陷检测、性能预测等方面的应用。详细分析了这些算法处理半导体相关数据的机制，探讨了算法实现中的关键技术，如数据预处理、模型训练与优化等。通过实际案例展示
计算机视觉国内外研究现状（综述）埃菲尔铁塔_CV算法计算机视觉
1.国内外研究进展1.2.1特征提取研究进展特征提取是图像处理的一个重要环节，是进行身份识别和行为识别的重要部分。近年来，针对不同特征的提取，国内外学者提出了许多特征提取算法，同样特征提取的效果大都不错。但是在复杂的猪舍环境中提取猪的特征还是比较困难的。下面针对几种目前常用的特征提取算法进行一些介绍。（1）传统的特征提取算法传统特征提取算法已经发展了很久，现阶段比较成熟，是深度学习算法出来之前研究
DeepSeek预言未来5年升值最快的东西 ZhuBin365 其它人工智能机器人
Thinking好的，我现在需要思考未来5年哪些东西可能会升值最快。首先，我得考虑当前的经济趋势和技术发展的方向。通货膨胀可能继续，所以实物资产可能保值。然后是科技领域，比如人工智能、量子计算这些前沿技术相关的资产可能会有增长。接着，环保和可持续发展是热门话题，可再生能源相关的产业可能会增值。例如，太阳能、风能的公司股票或者相关技术专利。另外，电动汽车和电池技术也可能持续发展，锂、钴等稀有金属的需
LLM大模型产品经理学习指南【2025全新版】：极致详细，一篇搞定！大模型入门学习产品经理语言模型人工智能 DeepSeek 大模型学习 LLM
前言·随着人工智能技术的蓬勃发展，尤其是大模型（LargeModel）的强势兴起，越来越多的企业对这一领域愈发重视并加大投入。作为大模型产品经理，需具备一系列跨学科的知识与技能，方能有效地推动产品的开发、优化以及市场化进程。以下是一份详尽的大模型产品经理学习路线，旨在助力你构建所需的知识体系，实现从零基础到精通的蜕变。一、基础知识阶段（一）计算机科学基础数据结构与算法：深入理解基本的数据结构（如数
销售易、极兔、珍客CRM：产品功能特色与企业适用性分析程序员机器学习人工智能
销售易CRM产品功能移动化与社交化：销售易CRM支持iOS、Android等主流操作系统，销售人员可以随时随地访问客户信息、更新销售进度、创建任务等。同时，它还具备社交化功能，能够整合企业内部的社交网络，促进员工之间的协作与沟通。AI与大数据驱动：销售易CRM融合了人工智能和大数据技术，通过智能数据分析，帮助企业洞察客户行为和需求，预测销售趋势。例如，AI可以对客户数据进行深度挖掘，识别出高价值客
前瞻技术：塑造未来生活的新趋势火龙果wa 生活人工智能经验分享
人工智能在艺术创作中的应用越来越普遍。AI可以生成画作、音乐和文学作品。它通过分析大量数据，学习艺术风格，并能创造出独特的作品。AI创作的艺术作品有几个特点。首先，它可以快速完成创作，节省时间。第二，AI能够融合多种风格。这使得作品更加多样化，有了新的表现形式。此外，AI常常会产生一些意想不到的创意，这能激发人们的灵感。艺术家与AI的合作也在逐渐发展。很多艺术家开始尝试与AI共同创作。他们使用AI
python 学习路线 Coding Happily python 学习 windows
学习顺序《python编程：从入门到实践》《Head-FirstPython》《“笨方法”学python3》《PythonCookbook》《Python机器学习基础教程》《FluentPython》《Python编程》《Python编程：从入门到实践》变量变量命名：仅用小写和下划线。变量本质:指向特定的值。字符串在字符串中使用变量：f’{varies1}{varies2}’更早版本:‘{}{}’
4.Python教程--项目部署篇（全）花开如雨笔记
Python人工智能总目录人工智能总目录网页链接文章目录Python人工智能总目录13、Python运维Day0113.1运维1.运维概述2.运维工具3.Linux常用命令4.周期性计划任务5.awk的使用14、Python项目部署Day0114.1项目部署1.概念2.项目部署(nginx+uwsgi+django)3.部署在线商城项目13、Python运维Day0113.1运维1.运维概述1、运
DeepSeek深度探索：从新手到高手的蜕变之旅古龙飞扬 ai 人工智能
引言在当今数字化与智能化的浪潮中，人工智能（AI）技术正以前所未有的速度改变着我们的生活和工作方式。DeepSeek，作为一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能模型，凭借其强大的功能和灵活的应用场景，成为了众多企业和专业人士的得力助手。本文将带你深入了解DeepSeek，从新手入门到高手进阶，掌握其核心功能与使用技巧，实现个人能力的蜕变。一、初识DeepSeek：人工智能的“
联想Y7000 2024版本笔记本 RTX4060安装ubuntu22.04双系统及深度学习环境配置七七@你一起学习深度学习 python
目录1..制作启动盘2.Windows磁盘分区，删除原来ubuntu的启动项3.四个设置4.安装ubuntu5.ubuntu系统配置1..制作启动盘先下载镜像文件，注意版本对应。Rufus-轻松创建USB启动盘用rufus制作时，需要注意选择正确的分区类型和系统类型。不然安装的系统会有问题！2.Windows磁盘分区，删除原来ubuntu的启动项手把手教你调整电脑磁盘的分区大小_调整分区大小-CS
AI前端开发的国际化发展机遇：ScriptEcho助力全球化布局 2401_89747417 人工智能前端
在全球化的今天，互联网应用已不再局限于单一市场。高效便捷的前端开发方案成为企业拓展国际市场的关键。得益于人工智能技术的飞速发展，AI代码生成器正在深刻改变前端开发模式，为国际化应用开发带来前所未有的机遇。然而，国际化开发也面临着诸多挑战，例如不同地区用户习惯、技术标准、语言差异等等。本文将探讨AI前端开发在国际化市场中的机遇与挑战，并以ScriptEcho为例，分析AI工具如何助力企业实现高效的全
【鸿蒙在OpenHarmony系统上集成OpenCV，实现图片裁剪】萌虎不虎 OpenHarmony harmonyos opencv 华为
鸿蒙在OpenHarmony系统上集成OpenCV，实现图片裁剪OpenCV介绍OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。它由一系列的C函数和少量C++类构成，同时提供Python、Java和MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。OpenCV具有极广的应用领域，它包括但不限于：人脸识别和物
中国人工智能的起步/发展，与这位数学家密切相关东锋1.3 人工智能人工智能
1979年在中国是一个重要的年份。这一年发生了诸多大事，也被视为中国在政治、经济、科技、文化等多个领域的一个重要转折点和中国近现代历史重要的时期断代点之一。相比1979年所开启的波澜壮阔的新时代，中国人工智能(ArtificialIntelligence，AI)研究在1979年的起步只能算历史大潮中的一朵不起眼的浪花，但在中国人工智能的历史里，这是开天辟地的大事件。人工智能最早的学派是符号主义学派
今日AI和商界事件(2025-02-07) LS_learner AI和商界事件人工智能
今日AI领域的相关事件包括但不限于以下几个方面：一、政策与监管美国众议员推动禁止政府设备使用中国AI应用DeepSeek：美国众议院两名来自两党的议员提议立法，禁止联邦政府设备使用中国人工智能应用DeepSeek，理由是中国政府可能利用该应用进行监视和散布虚假信息。这一事件反映了地缘政治紧张背景下，各国在关键技术领域对自主性和安全性的重视。二、行业动态与发展OpenAI推进“星际之门”项目：Ope
使用 HuggingFace 库进行本地嵌入向量生成 qq_37836323 python 人工智能开发语言
在当今的AI和机器学习应用中，嵌入向量（embeddings）已成为不可或缺的一部分。嵌入向量能够将文本等高维数据转换为低维稠密向量，从而便于计算和分析。在本文中，我们将介绍如何使用HuggingFace库在本地生成嵌入向量，并演示相关代码。环境准备首先，我们需要安装一些必要的依赖库。可以通过以下命令进行安装：#安装必要的库!pipinstallsentence-transformers!pipi
精通LangChain：如何使用Unstructured处理多种格式的图像文档 hshahtjtbh langchain python
#引言随着人工智能和深度学习的快速发展，文档图像分析(DocumentImageAnalysis,DIA)在许多领域中变得至关重要。然而，处理多种图像格式的文档仍然是一个挑战。本文将介绍如何使用Unstructured库，通过LangChain框架加载和处理多种格式的图像文档，帮助您在DIA任务中实现更高效的工作流程。#主要内容##安装Unstructured在开始之前，确保安装了Unstruct
《深入了解Unstructured包：在LangChain中使用Unstructured.IO提取干净文本》 cgsayuclv langchain python
引言在现代数据处理和人工智能应用中，解析和清洗文本数据是一个重要的环节。无论是PDF文件、Word文档还是CSV文件，能够高效地提取有用信息对下游任务至关重要。这篇文章将介绍如何使用Unstructured.IO的Unstructured包来从原始文档中提取干净文本，并在LangChain框架中使用它。本文将包含安装与设置指南、详细教程、代码示例、常见问题及解决方案，并提供进一步学习的资源。主要内
DeepSeek-V2模型版本更新：探索高效经济的多专家混合架构姜葵烽
DeepSeek-V2模型版本更新：探索高效经济的多专家混合架构DeepSeek-V2项目地址:https://gitcode.com/hf_mirrors/ai-gitcode/DeepSeek-V2在人工智能模型的发展进程中，每一次版本更新都是对前一次成果的深化与完善。今天，我们将详细介绍DeepSeek-V2模型的新版本特性，以及它如何通过创新的架构设计，实现了在性能和成本之间的最佳平衡。新
【人工智能】Python中的深度学习优化器：从SGD到Adam 蒙娜丽宁 Python杂谈人工智能人工智能 python 深度学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在深度学习模型的训练过程中，优化器起着至关重要的作用，它决定了模型的收敛速度以及最终的性能。本文将介绍深度学习中常用的优化器，从传统的随机梯度下降（SGD）到现代的自适应优化器（如Adam）。我们将深入探讨每种优化器的原理、优缺点，并通过Python实现
【人工智能】基于Python和OpenCV实现实时人脸识别系统：从基础到应用蒙娜丽宁 Python杂谈人工智能 python 开发语言
随着人工智能和计算机视觉的快速发展，人脸识别技术已广泛应用于监控、安全、社交媒体、金融和医疗等领域。本文将介绍如何利用Python和OpenCV库，结合dlib进行实时人脸识别的实现。通过构建一个基础的实时人脸识别系统，读者将深入了解人脸检测与识别的核心原理，掌握如何使用现有的计算机视觉工具快速开发一个有效的实时系统。本文将详细介绍如何通过OpenCV和dlib来实现人脸检测与识别，如何实时获取摄
机器学习面试笔试知识点-线性回归、逻辑回归(Logistics Regression)和支持向量机(SVM) qq742234984 机器学习线性回归逻辑回归
机器学习面试笔试知识点-线性回归、逻辑回归LogisticsRegression和支持向量机SVM微信公众号：数学建模与人工智能一、线性回归1.线性回归的假设函数2.线性回归的损失函数（LossFunction）两者区别3.简述岭回归与Lasso回归以及使用场景4.什么场景下用L1、L2正则化5.什么是ElasticNet回归6.ElasticNet回归的使用场景7.线性回归要求因变量服从正态分布
【AI】人工智能没那么神秘！仇辉攻防人工智能 ai 语言模型自然语言处理机器学习深度学习网络安全
AI是什么？人工智能（ArtificialIntelligence），英文缩写为AI。AI人工智能不是简单的应用程序，而是一类技术，包含机器学习、自然语言处理、计算机视觉等多个领域。AI系统通常由算法、数据、模型和代码组成，其中代码用于实现算法，数据用于训练模型，最终形成智能决策能力。AI可以嵌入到应用程序中，但其本身是一个复杂的技术体系。AI为什么这么聪明？AI之所以看起来很聪明，主要是因为它通
机器学习: 逻辑回归小源学AI 人工智能机器学习逻辑回归人工智能
概念与定义逻辑回归是一种用于分类问题的统计方法。它通过计算目标变量的概率来预测类别归属，并假设数据服从伯努利分布（二分类）或多项式分布（多分类）。逻辑回归模型输出的是概率值，通常使用sigmoid函数将线性组合映射到0和1之间。1.概念逻辑回归用于解决分类问题，特别是二分类问题。它通过估计输入变量与目标变量之间的关系来预测目标变量的类别。2.定义逻辑回归是一种广义线性模型，其核心思想是将线性组合通
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str