xiaojiegege123456

Gradient And Karush-Kuhn-Tucker Conditions

一、梯度是什么？

1、一个小例子

假设有单变量实值函数，其图形如下：

实值函数在点的导数的意义是该函数在处的瞬时变化率，即：

在自变量发生微小变化时，目标函数值的变化可以这么描述：

针对上图有以下三种情况：

(1)、点位置，此时，在点做微小正向变化：，显然有，这说明在点往轴正向有可以使目标函数值增大点存在；

(2)、点位置，此时，在点做微小负向变化：，显然有，这说明在点往轴负向有可以使目标函数值增大点存在；

(3)、点位置，此时，不管在点做微小负向变化还是正向变化都有，这说明在点是一个最优解。

实际上，在一维情况下目标函数的梯度就是，它表明了目标函数值变化方向。

2、梯度与方向导数

(1)、方向导数

以二元函数：为例，设它在点的某个邻域内有定义，以点出发引射线，为上的且在邻域内的任意点，则方向导数的定义为：

$\frac{\partial f}{\partial l} = \lim_{\rho->0^+} {\frac{f(x_0+\Delta x_0,x_1+\Delta x_1)-f(x_0,x_1)}{\rho}}$ 其中表示和两点之间的欧氏距离：

从这个式子可以看到：方向导数与某个方向有联系、方向导数是个极限值、方向导数与偏导数似乎有联系。

实际上，如果在点可微，则：

$\frac{\partial f}{\partial l} = \frac{\partial f}{\partial x_0} \cos\alpha +\frac{\partial f}{\partial x_1} \cos\beta$ 其中和分别是两个维度上的方向角

这里需要注意的一个细节是：沿某个维度的方向导数存在时，其偏导数不一定存在，原因就是方向导数只要求半边极限存在()，而偏导数则要求双边都存在。

(2)、梯度

把方向导数变换一下形式：

$\frac{\partial f}{\partial l} = \frac{\partial f}{\partial x_0} \cos\alpha +\frac{\partial f}{\partial x_1} \cos\beta$

$=(\frac{\partial f}{\partial x_0}\quad \quad \quad ,\quad \quad \quad \frac{\partial f }{\partial x_1}) \cdot (\cos\alpha \quad \quad \quad ,\quad \quad \quad \cos\beta)$

函数在点的梯度就被定义为向量：

与射线同方向的单位向量被定义为：

于是方向导数变成了：

我的理解是：方向导数描述了由各个维度方向形成的合力方向上函数变化的程度，当这个合力方向与梯度向量的方向相同时，函数变化的最剧烈，我想这就是为什么在梯度上升算法或者梯度下降算法中选择梯度方向或者负梯度方向的原因吧。换句话说就是：函数在某点的梯度是这样一个向量，它的方向与取得最大方向导数的方向一致，而它的模为方向导数的最大值。

某个函数和它的等高线，图中标出了a点的梯度上升方向

3、多维无约束问题

将开篇的那个小例子扩展到多维的情况，目标函数值将会成为一个向量，向任意个维度方向做微小变动都将对目标函数值产生影响，假设有n个维度，可以用下面的式子描述：

令

(1)、当，此时，因此可以从点移动使得目标函数值增加；

(2)、当，此时，因此可以从点移动使得目标函数值减少；

(3)、当，梯度向量和正交（任一向量为0也视为正交），不管从点怎样移动都找不到使目标函数值发生变化的点，于是点就是目标函数的最优解。

由于可以是任意方向向量，只要点的梯度向量不为零，从点出发总可以找到一个变化方向使得目标函数值向我们希望的方向变化（比如就找梯度方向，此时能引起目标函数值最剧烈地变化），理论上当最优解出现时就一定有（实际上允许以某个误差结束），比如，对于梯度下降算法，当时迭代结束，此时的为最优解（可能是全局最优解也可能是局部最优解）：

二、拉格朗日乘数法和KKT条件

从现在开始，我假设目标函数和约束在某点可微，用符号代替符号。

1、等式约束

在约束条件的作用下，与点（它是个向量）可移动方向相关的向量就不像无约束问题那样随便往哪个方向都能移动了，此时只能沿着约束曲线移动，例如，在、处，和不正交，说明还有使目标函数值更小的等高线存在，所以点还有移动的余地，当移动到位置时和正交，得到最优解。那么在最优解处和约束有什么关系呢？因为此时，，显然此时有（其中是常数），也就是说约束的梯度向量与目标函数的梯度向量在最优解处一定平行。

想到求解此类优化问题时最常用的方法——拉格朗日乘数法，先要构造拉格朗日函数：

其中，是常数

为什么求解拉格朗日函数得到的最优解就是原问题的最优解呢？

假设、为的最优解，那么就需要满足：

$\begin{eqnarray*} \\ \nabla f(x^*)-\lambda^* \nabla h(x^*)&=& 0\\ \\ h(x^*)&=&0\\ \end{eqnarray*}$

第一个式子印证了约束的梯度向量与目标函数的梯度向量在最优解处一定平行，第二个式子就是等式约束本身。

于是：

$\begin{eqnarray*} &&L(x,\lambda) &\geq &L(x^*,\lambda^*)\\ \Rightarrow&& f(x)-\lambda h(x) &\geq &f(x^*)-\lambda^* h(x^*) \\ \Rightarrow &&f(x) &\geq & f(x^*) \end{eqnarray*}$

2、不等式约束

实际情况中，约束条件可能是等式约束也可能是不等式约束或者同时包含这两种约束，下面描述为更一般地情况：

$\begin{eqnarray*} & \min &f(x)\\ & s.t.& h_i(x)=0 \quad (i=0 ... n)\\ &&g_j(x) \leq 0 \quad (j=0...m) \end{eqnarray*}$

依然使用拉格朗日乘数法，构造拉格朗日函数：

$L(x,\alpha ,\beta) = f(x) + \sum\limit_{i=0}^n \alpha_i \cdot h_i(x) + \sum\limit_{j=0}^m \beta_j\cdot g_j(x)$ 其中且

在这里不得不说一下Fritz John 定理了，整个证明就不写了（用局部极小必要条件定理、Gordan 引理可以证明）。

定理1：

依然假设为上述问题的极小值点，问题中涉及到的各个函数一阶偏导都存在，则存在不全为零的使得下组条件成立：

$\lambda_0 \nabla f(x^*) + \sum\limit_{i=0}^n \lambda_i \cdot \nabla h_i(x^*) + \sum\limit_{j=0}^m \lambda_j\cdot \nabla g_j(x^*)=0$

这个定理第一项的形式类似于条件极值必要条件的形式，如果则有效约束会出现正线性相关，由Gordan 引理知道此时将存在可行方向，就是将不是原问题的极值点，因此令则线性无关则。

这个条件又叫互不松弛条件（Complementary Slackness），SVM里的支持向量就是从这个条件得来的。

由Fritz John 定理可知线性无关则，让每一个拉格朗日乘子除以，即，得到下面这组原问题在点处取得极小值一阶必要条件。

定理2：

假设为上述问题的极小值点，问题中涉及到的各个函数一阶偏导都存在，有效约束线性无关，则下组条件成立：

$\frac{\part L(x,\mu_i,\mu_j)}{\par tx} =\nabla f(x^*) + \sum\limit_{i=0}^n \mu^*_i \cdot \nabla h_i(x^*) + \sum\limit_{j=0}^m \mu^*_j\cdot \nabla g_j(x^*)=0$

这组条件就是Karush-Kuhn-Tucker条件，满足KKT条件的点就是KKT点，需要注意的是KKT条件是必要条件（当然在某些情况下会升级为充要条件，比如凸优化问题）。

由此也可以想到求解SVM最大分类间隔器时，不管是解决原问题还是解决对偶问题，不管是用SMO方法或其它方法，优化的过程就是找到并优化违反KKT条件的最合适的乘子。

KKT条件与对偶理论有密切的关系，依然是解决下面这个问题：

$\begin{eqnarray*} & \min &f(x)\\ & s.t.& h_i(x)=0 \quad (i=0 ... n)\\ &&g_j(x) \leq 0 \quad (j=0...m) \end{eqnarray*}$

构造拉格朗日函数：

$L(x,\alpha ,\beta) = f(x) + \sum\limit_{i=0}^n \alpha_i \cdot h_i(x) + \sum\limit_{j=0}^m \beta_j\cdot g_j(x)$ 其中且，它们都是拉格朗日乘子

令，原问题可以表示为下面这个形式：

$O_p(x)= \left\{ \begin{array}{c} &f(x)& if \quad x \quad satisfies \quad primal \quad constraints&\\ & \infty& otherwise.&\\ \end{array} \right.$

这个式子比较容易理解，当违反原问题约束条件时有：

$O_p(x)=\max\limit_{\alpha ,\beta} L(x,\alpha ,\beta) = \max\limit_{\alpha, \beta} f(x) + \sum\limit_{i=0}^n \alpha_i \cdot h_i(x) + \sum\limit_{j=0}^m \beta_j\cdot g_j(x)=\infty$

于是原问题等价为下面这个问题：

它的最优解记为

令，则有以下形式：

它的最优解记为

上面这两个形式很像，区别只在于和的顺序，实际上和互为对偶问题。因为，打个不太恰当的比喻，这就像瘦死的骆驼比马大，具体的证明就不写了，所以，这个就是弱对偶性，此时存在对偶间隙，它被定义为：。

有弱对偶性就有强对偶性，它指的是在某些条件下有，比如在以下条件下满足强对偶性：

目标函数和所有不等式约束函数是凸函数，等式约束函数是仿射函数(形如)，且所有不等式约束都是严格的约束(大于或小于)。

KKT条件和强对偶性的关系是：

KKT条件是强对偶性成立的必要条件，特别的，当原问题是凸优化问题时，KKT条件就是充要条件，强对偶性存在时KKT点既是原问题的解也是对偶问题的解，这个时候对偶间隙为0。

关于对偶问题可以参考pluskid写得非常好的一篇文章：http://blog.pluskid.org/?p=702

三、总结

梯度是一个基础而重要的概念，函数在某点的梯度是这样一个向量，它的方向与取得最大方向导数的方向一致，而它的模为方向导数的最大值，梯度下降算法正是依据这一原理，还有在求解极大似然问题时也可以用梯度上升的算法进行参数估计；对于约束最优化问题可以使用拉格朗日乘数法解决——如：构造拉格朗日函数，求出KKT条件；当原问题不太好解决的时候可以利用拉格朗日乘数法得到其对偶问题，满足强对偶性条件时它们的解会是一致的，SVM问题的解决把这一点用的淋漓尽致，同时也为我们提供了一种判断算法收敛情况的方法——监视可行间隙。

四、参考资料

1、Stephen Boyd and Lieven Vandenberghe. 《Convex Optimization》

2、Jorge Nocedal and Stephen J. Wright.《Numerical Optimization》second Edition

3、Andrew Ng.http://v.163.com/special/opencourse/machinelearning.html

4、pluskid. http://blog.pluskid.org/

Python实现梯度下降法闲人编程 python python 开发语言梯度下降算法优化
博客：Python实现梯度下降法目录引言什么是梯度下降法？梯度下降法的应用场景梯度下降法的基本思想梯度下降法的原理梯度的定义学习率的选择损失函数与优化问题梯度下降法的收敛条件Python实现梯度下降法面向对象的设计思路代码实现示例与解释梯度下降法应用实例：线性回归场景描述算法实现结果分析与可视化梯度下降法的改进版本随机梯度下降（SGD）小批量梯度下降（Mini-batchGradientDesce
C# 图形图像技术（通过Graphics绘制图像）萨达大 c#开发语言
文章目录创建Graphics对象画笔与画刷画笔画刷SolidBrush类HatchBrush类LinerGradientBrush类基本图形绘制矩形椭圆圆弧扇形创建Graphics对象privatevoidForm1_Load(objectsender,Eventargse){Graphicsghs=this.CreateGraphics();}画笔与画刷画笔构造函数publicPen(Color
梯度提升机 (Gradient Boosting Machines, GBM) ALGORITHM LOL boosting 集成学习机器学习
梯度提升机(GradientBoostingMachines,GBM)通俗易懂算法梯度提升机（GradientBoostingMachines，GBM）是一种集成学习算法，主要用于回归和分类问题。GBM本质上是通过训练一系列简单的模型（通常是决策树），然后将这些模型组合起来，从而提高整体预测性能。基本步骤初始模型：首先，我们用一个简单的模型（如一个常数值）作为预测模型，记为F0(x)F_0(x)F
当背景为两种颜色交替出现时？用重复性渐变实现痛心凉
重复性渐变cssdiv{background-image:linear-gradient(0deg,rgba(255,255,255,.2)50%,transparent50%,transparent);background-size:37px37px;background-color:#EBEBEB;//按需要改动背景色}
Python——渐变色星和月 python
在Python的turtle模块中，可以使用colorsys库来创建渐变色。importturtleimportcolorsysdefdraw_gradient(start_color,end_color):screen=turtle.Screen()screen.colormode(255)turtle.speed(0)turtle.penup()turtle.goto(-200,-200)tu
html字体如何设置渐变,CSS 实现文字渐变色甄公子 html字体如何设置渐变
CSS实现文字渐变，有下面两种方法：1.background属性.text-gradient{background-image:linear-gradient(toright,orange,purple);-webkit-background-clip:text;color:transparent;font-size:30px;}文字渐变效果如下：实现原理：background-image属性为该
《机器学习》—— XGBoost（xgb.XGBClassifier）分类器张小生180 机器学习人工智能
文章目录一、XGBoost分类器的介绍二、XGBoost（xgb.XGBClassifier）分类器与随机森林分类器（RandomForestClassifier）的区别三、XGBoost（xgb.XGBClassifier）分类器代码使用示例一、XGBoost分类器的介绍XGBoost分类器是一种基于梯度提升决策树（GradientBoostingDecisionTree，GBDT）的集成学习算
【CSS】如何写渐变色文字并且有打光效果努力挣钱的小鑫 CSS css 前端 css3
效果如上，其实核心除了渐变色文字的设置background:linear-gradient(270deg,#d2a74294%,#f6e2a725%,#d5ab4a48%,#f6e2a782%,#d1a6414%);color:#e8bb2c;background-clip:text;color:transparent;还有就是打光效果，原理其实就是两块遮罩，如下完整代码自己再根据自己需求调整下就
如何在Java中实现高效的分布式梯度下降算法省赚客app开发者 java 分布式算法
如何在Java中实现高效的分布式梯度下降算法大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在本文中，我们将探讨如何在Java中实现高效的分布式梯度下降算法。分布式梯度下降（DistributedGradientDescent）是一种常用于训练大规模机器学习模型的优化方法，特别是在处理大规模数据集时非常有效。本文将介绍如何设计和实现这一算法，以提高训练效率。分布式梯度
强化学习分类 0penuel0
Model-free:Qlearning,Sarsa,PolicyGradientsModel-based:能通过想象来预判断接下来将要发生的所有情况.然后选择这些想象情况中最好的那种基于概率：PolicyGradients基于价值：Qlearning,Sarsa两者融合：Actor-Critic回合更新：Monte-carlolearning，基础版的policygradients单步更新：Ql
3.3.1 Life & Conditions 2 亲爱的末日
Inmoderntimeswehumansfacechangingconditions.Forhumanstolive,weneedcleanairandcleanwater.Pollutionisnowagrowingproblemaroundtheworld.Pollutionpoisonstheairandwaterthatwedependon.Pollutedairmakespeoples
实现带有弧度的左右边角 kilito_01 css
像这样的圆角要怎么实现从结构上来看是用before和after来实现的对激活项进行设置一个定位对before进行一个相对定位放在左下角重点就在于这个背景css的设置进行一个圆形的渐变把圆心定在左上角这个圆形的背景就是透明的剩下的就是这个#f5f5f5的颜色就能实现这种带弧度的角background:radial-gradient(circleat00,transparent25px,#f5f5f5
css3属性linear-gradient兼容ie9问题曲米茶
1.在vue-cli构建的商城项目中发现background-image:linear-gradient(toright,#ff0067,#ff5698);在ie9中失效，无法显示任何内容。解决方案：IE可以依靠滤镜实现渐变。startColorstr表示起点的颜色，endColorstr表示终点颜色。GradientType表示渐变类型，0为缺省值，表示垂直渐变，1表示水平渐变。filter:p
flutter 开发中常用的 Widget 执念1012 flutter android ios flutter javascript 前端 ios 安卓
flutter开发中常用的Widget原文地址Containerwidth宽度height高度margin设置外间距padding设置内间距alignment对其方式decorationDecoration对Container进行修饰gradient渐变boxShadow阴影transform设置形变constraints设置Contianer最大、最小宽高color背景颜色child子组件注意，
Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples winddy_akoky
1.介绍作为基于迭代优化攻击的基准测试已经成为评估防御的标准实践，新的防御出现了，似乎对这些强大的基于优化的攻击具有强大的抵抗力。Kurakin,A.,Goodfellow,I.,andBengio,S.Adversar-ialexamplesinthephysicalworld.arXivpreprintarXiv:1607.02533,2016a.Madry,A.,Makelov,A.,Sch
深度学习中的梯度消失和梯度爆炸问题码上飞扬深度学习人工智能梯度消失梯度爆炸
在深度学习领域，随着模型层数的增加，我们常常会遇到两个棘手的问题：梯度消失（VanishingGradients）和梯度爆炸（ExplodingGradients）。这两个问题严重影响了深度神经网络的训练效率和性能。本文将详细介绍这两个问题，并通过实例帮助读者更好地理解。一、梯度消失问题梯度消失是深度学习中的一大难题，尤其在训练深度神经网络时显得尤为棘手。这一问题的本质在于，当我们在训练过程中通过
基于Python的机器学习系列（18）：梯度提升分类（Gradient Boosting Classification）会飞的Anthony 信息系统机器学习人工智能机器学习 python 分类
简介梯度提升（GradientBoosting）是一种集成学习方法，通过逐步添加新的预测器来改进模型。在回归问题中，我们使用梯度来最小化残差。在分类问题中，我们可以利用梯度提升来进行二分类或多分类任务。与回归不同，分类问题需要使用如softmax这样的概率模型来处理类别标签。梯度提升分类的工作原理梯度提升分类的基本步骤与回归类似，但在分类任务中，我们使用概率模型来处理预测结果：初始化模型：选择一个
深度学习速通系列:梯度消失vs梯度爆炸 Ven% 深度学习速通系列人工智能深度学习 python
梯度消失和梯度爆炸是深度学习中训练深层神经网络时常见的两个问题，它们影响网络的训练过程和性能。梯度消失（VanishingGradientProblem）定义：梯度消失是指在深层神经网络的反向传播过程中，由于链式法则，梯度值随着层数的增加而迅速减小，最终趋近于零。原因：激活函数的导数很小，如Sigmoid或Tanh函数在输入值非常大或非常小的时候导数接近零。权重初始化不当，导致梯度在网络中的传播过
鸿蒙HarmonyOS NEXT开发：颜色渐变（ArkTS通用属性）「已注销」鸿蒙 ArkTS harmonyos 华为鸿蒙 android 驱动开发
颜色渐变设置组件的颜色渐变效果。说明：从APIVersion7开始支持。后续版本如有新增内容，则采用上角标单独标记该内容的起始版本。linearGradientlinearGradient(value:{angle?:number|string;direction?:GradientDirection;colors:Array;repeating?:boolean;})线性渐变。卡片能力：从API
基于Python的机器学习系列（17）：梯度提升回归（Gradient Boosting Regression）会飞的Anthony 人工智能信息系统机器学习机器学习 python 回归
简介梯度提升（GradientBoosting）是一种强大的集成学习方法，类似于AdaBoost，但与其不同的是，梯度提升通过在每一步添加新的预测器来减少前一步预测器的残差。这种方法通过逐步改进模型，能够有效提高预测准确性。梯度提升回归的工作原理在梯度提升回归中，我们逐步添加预测器来修正模型的残差。以下是梯度提升的基本步骤：初始化模型：选择一个初始预测器h0(x)，计算该预测器的预测值。计算残差：
梯度下降算法（Gradient Descent Algorithm）海棠未语算法机器学习人工智能 python
目录一、梯度下降算法简述二、不同函数梯度下降算法表示1、一元函数2、二元函数3、任意多元函数三、梯度计算四、常见的梯度下降法1、批量梯度下降算法（BatchGradientDescent）2、随机梯度下降算法（StochasticGradientDescent）3、小批量梯度下降(Mini-batchGradientDescent)4、梯度下降算法注意点与调优5、冲量梯度下降算法（Momentum
【ShuQiHere】SGD vs BGD：搞清楚它们的区别和适用场景 ShuQiHere 机器学习 python 人工智能
【ShuQiHere】在机器学习中，优化模型是构建准确预测模型的关键步骤。优化算法帮助我们调整模型的参数，使其更好地拟合训练数据，减少预测误差。在众多优化算法中，梯度下降法是一种最为常见且有效的手段。梯度下降法主要有两种变体：批量梯度下降（BatchGradientDescent,BGD）和随机梯度下降（StochasticGradientDescent,SGD）。这两者在如何计算梯度并更新模型参
33.鼠标悬停时的波浪线效果 & CSS 重置 @大迁世界 CSS 技巧与案例详解 css 前端
鼠标悬停时的波浪线效果在鼠标悬停在链接上时创建波浪线效果。使用linear-gradient为链接创建重复背景。为链接创建一个:hover状态,其background-image为一个包含带有波浪路径和动画的SVG的dataURL。The<aclass="squiggle"href="#"
css3的mask遮罩属性笔记 zhanle_huang 前端编程类 css3 css3 css 前端
css3的mask遮罩属性笔记mask笔记mask笔记通过渐变来绘制显示的区域，透明的则代表不显示，不透明则表示显示-webkit-mask:radial-gradient(circleat0,#000020px,red0,#000030px),radial-gradient(circleatright,#000020px,red0);遮罩大小size-webkit-mask-size:51%;重
matlab实现梯度下降优化算法孺子牛 for world matlab 算法开发语言
梯度下降（GradientDescent）是一种常用的优化算法，用于寻找函数的局部最小值。在机器学习领域，它常被用来优化模型的参数，比如线性回归、逻辑回归以及神经网络等模型的权重和偏置。以下是一个简单的MATLAB实现梯度下降算法的示例，该示例将用于优化一个简单的二次函数f(x)=ax2+bx+c的最小值点。为了简化问题，我们假设a=1,b=0,c=1，即函数为f(x)=x2+1，其最小值点为x=
微信小程序--文字添加渐变和阴影 cccc☜ 微信小程序 css 微信小程序小程序
微信小程序–文字添加渐变和阴影1、文字添加渐变text{font-size:32rpx;background:linear-gradient(toright,#ff9d3d,#fff1d7,#ffb853);-webkit-background-clip:text;-webkit-text-fill-color:transparent;}警告提示：Alsodefinethestandardprop
数学基础 -- 梯度下降算法 sz66cm 算法人工智能数学基础
梯度下降算法梯度下降算法（GradientDescent）是一种优化算法，主要用于寻找函数的局部最小值或全局最小值。它广泛应用于机器学习、深度学习以及统计学中，用于最小化损失函数或误差函数。梯度下降的基本概念梯度下降算法通过以下步骤工作：初始化参数：随机初始化模型的参数（如权重和偏差），也可以用特定的策略初始化。计算损失：对当前模型输出和实际目标值计算损失（如均方误差、交叉熵等）。计算梯度：计算损
uniapp+vue3的双向渐变总萌大人 uni-app 前端 vue.js
在App.vue中/*每个页面公共css*/@import'common/style/common-style.scss'在common-style.scss中//全局双向渐变.pageColor{background:linear-gradient(tobottom,rgba(0,0,0,0),#fff400rpx),//到400rpx才做白色渐变linear-gradient(toright,
四十一、【人工智能】【机器学习】- Bayesian Logistic Regression算法模型暴躁的大熊人工智能人工智能机器学习算法
系列文章目录第一章【机器学习】初识机器学习第二章【机器学习】【监督学习】-逻辑回归算法(LogisticRegression)第三章【机器学习】【监督学习】-支持向量机(SVM)第四章【机器学习】【监督学习】-K-近邻算法(K-NN)第五章【机器学习】【监督学习】-决策树(DecisionTrees)第六章【机器学习】【监督学习】-梯度提升机(GradientBoostingMachine,GBM
python实现梯度下降优化算法孺子牛 for world python 算法机器学习
梯度下降（GradientDescent）是一种常用的优化算法，用于求解无约束优化问题。在机器学习中，它常被用来更新模型的参数以最小化某个损失函数。以下是一个简单的Python示例，展示如何实现梯度下降算法来优化一个二次函数的参数。假设我们要优化的函数是f(x)=x2，我们希望找到使得f(x)最小的x值。显然，对于这个函数，最小值出现在x=0。首先，我们需要计算f(x)的梯度（导数），即f′(x)
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号