拉格朗日乘数法基础

背景

线性可分 SVM 的目标函数最终转换为一个带约束条件的求极值问题,而拉格朗日乘子法,恰恰是一种多元函数在变量受到条件约束时,求极值的方法。正好可以用来解决 SVM 的目标函数最优化。

那么拉格朗日乘数法的理论过程如何呢?

本文将摘录高等数学下册中拉格朗日乘数法的数学知识,08年学的高等数学下册,十多年了早还给老师了,只是还保留着当年的书本,这次春节回家把两本高数书带来了,当作AI学习的参考资料。
拉格朗日乘数法基础_第1张图片
(百度来的图片)理工科的同学们看到它有没有觉得很亲切?

拉格朗日乘数法

拉格朗日乘数法基础_第2张图片

这段话作为引言,说明多元函数求取最大值的过程中,受限于一定的条件,接下来以长方体体积的问题继续讨论。

公式(1)和(2)比较好理解,分别表示我们待求取的问题的二元函数和二元函数满足的约束条件。

这里求取了y关于自变量x的隐函数Ψ(x),那么z就转换为一元函数了。
关于公式(5)和(2)隐函数的求导公式的知识还要再查找补充下,这里姑且就当作是已知条件吧,继续看后面的说明过程。
拉格朗日乘数法基础_第3张图片
(图四)

式子(7)中的第一、三两个好理解,第二个怎么来的待解释。
拉格朗日乘数法基础_第4张图片

实际应用:
拉格朗日乘数法基础_第5张图片

启示录

从图四拉格朗日乘法的说明来看,本质上就是构造了一个拉格朗日函数,然后分别对其求偏导数,加上约束条件而得到的式子(8)本质上跟前面推导过程中的假设得到的公式(7)一致。

我的感觉这也仅仅是一个知识点的介绍,关键的思想并没有提及:比如,为什么拉格朗日函数是关于x,y的两个函数呢?它把目标函数f(x,y)和限制函数φ(x,y)整合在一起,对求极值的意义何在?

扩展搜索时在知乎上看到一个例子解释这个公式比较清晰的,参考链接为:https://www.zhihu.com/question/38586401/answer/134473412
点击GIF动态图有助于更好理解推导过程。

你可能感兴趣的:(简单东西,机器学习笔记录)