本来想直接去学习机器学习的算法的,后来想想还是需要先把基础的数学概念性的看一下,所以决定先从数学知识看起来吧。这里也对微积分做一点基础概念的理解,大学时候的数学也有很多已经遗忘了.这里总结下微积分的一些知识,用作后面的学习。
设f(x)定义在x0的一个可能不包括x0的区间上,我们说当x趋于x0时,f(x)趋于极限L,并记为:
假设在包含c在内的某个开区间中除x = c外所有的x,有 g(x)⩽f(x)⩽h(x) ,又假设
如图所示
∵sinx<x<tanx
→1<xsinx<1cosx
→cosx<sinxx<1
∵limx→0cosx=cos0=1 ,从而推出:
Xn=(1+1n)n
=1+C1n1n+C2n1n2+C3n1n3+⋯+Cnn1nn
=1+n⋅1n+n(n−1)2!⋅1n2+n(n−1)(n−2)3!⋅1n3+⋯+n(n−1)(n−2)⋯1n!⋅1nn
=1+1+12!⋅(1−1n)+13!⋅(1−1n)(1−2n)+⋯+1n!⋅(1−1n)⋯(1−n−1n)
=1+1+12!+13!+⋯++1n!
<1+1+12+122+⋯++12n−1
=3−12n−1
<3
其实这个极限的值为自然数e。
f(x) | f′(x) |
---|---|
C | 0 |
sinx | cosx |
xn | nxn−1 |
ax | axlna |
ex | ex |
logax | 1xlogae |
lnx | 1x |
(u+v) | u′+v′ |
uv | u′v+uv′ |
函数y=f(x)在某区间有定义, x0 及 x0+Δx 在这区间内,如果函数的增量
通常把自变量x的增量 Δx 称为自变量的微分,记作dx,即 dx=Δx ,于是函数y=f(x)的微分记作
引用知乎上的一个回答,泰勒公式:就是用多项式函数去逼近光滑函数。
0 | 1 |
---|---|
1+x−−−−−√n≈1+1nx | sinx≈x |
tanx≈x | ex≈1+x |
ln(1+x)≈x | 1−x1+x−−−√≈1−x |
设f(x)在区间[a, b]上连续, f(a)⋅f(b)<0 且方程f(x)=0在(a, b)内仅有一个实根,然后,每次把区间缩小一半,具体选择左半区还是右半区的原则是使得方程异号。循环该过程,区间的中间点不断逼近方程的根。
如下图可以形象的表示出来,首先取[a1,b1],然后[a1,b2],接着[a2, b2], 接着[a3, b2],依次类推,慢慢接近f(x) = 0,最后求出近似解,这个和循环的次数相关。
首先,选择一个接近函数f(x)零点的x0,计算相应的f(x0)和切线斜率f’(x0)。然后我们计算穿过点(x0,f(x0))并且斜率为f’(x0)的直线和x轴的交点的x坐标,也就是求如下方程的解:
如果区间I上,可导函数F(x)的导函数为f(x),即对任一 x∈I ,都有
0 | |
---|---|
∫kdx=kx+C | ∫xμdx=xμ+1μ+1+C |
∫dxx=ln|x|+C | ∫dx1+x2=arctanx+C |
∫dx1−x2√=arcsinx+C | ∫cosxdx=sinx+C |
∫sinxdx=−cosx+C | ∫dxcos2x=∫sec2xdx=tanx+C |
∫dxsin2x=∫csc2xdx=−cotx+C | ∫secxtanxdx=secx+C |
∫cscxcotxdx=−cscx+C | ∫exdx=ex+C |
∫axdx=axlna+C | ∫shxdx=chx+C |
∫chxdx=shx+C | |
分部积分: uv′=uv−u′v | 分部积分: ∫udv=uv−∫vdu |
如下图所示:
故,记做 ∫baf(x)=∑(fx)dx ,所以定积分在最初定义的时候,就是被定义成面积的。 牛顿-莱布尼兹公式: 如果函数 F(x)是连续函数 f(x)在区间 [a,b]上的一个原函数,那么 f(x,y) 在点 P0 的梯度向量是由求 f 在 P0 的偏导数的值得到的向量:
雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近. 因此, 雅可比矩阵类似于多元函数的导数.
假设 F:Rn→Rm 是一个从欧式n维空间转换到欧式m维空间的函数. 这个函数由m个实函数组成: y1(x1,…,xn),…,ym(x1,…,xn) .这些函数的偏导数(如果存在)可以组成一个m行n列的矩阵, 这就是所谓的雅可比矩阵:
此矩阵表示为: JF(x1,⋯,xn) , 或者 ∂(y1,⋯,ym)∂(x1,⋯,xn)
雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近。因此,雅可比矩阵类似于多元函数的导数。雅可比矩阵定义为向量对向量的微分矩阵。
如果m = n, 那么 F 是从n维空间到n维空间的函数, 且它的雅可比矩阵是一个方块矩阵. 于是我们可以取它的行列式, 称为雅可比行列式.
在数学中, 海森矩阵(Hessian matrix或Hessian)是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵, 此函数如下:
假设 f(x,y,z) 和 g(x,y,z) 是可微的,求为 f 在约束 g(x,y,z)=0 下的局部最大值和最小最小值,就求 x,y,z 和 λ 的值,使它们同时满足
设想我们的目标函数 z=f(x) , x 是向量, z 取不同的值,相当于可以投影在 x 构成的平面(曲面)上,即成为等高线,如下图,目标函数是 f(x,y) ,这里 x 是标量,虚线是等高线,现在假设我们的约束 g(x)=0 , x 是向量,在 x 构成的平面或者曲面上是一条曲线,假设 g(x) 与等高线相交,交点就是同时满足等式约束条件和目标函数的可行域的值,但肯定不是最优值,因为相交意味着肯定还存在其它的等高线在该条等高线的内部或者外部,使得新的等高线与目标函数的交点的值更大或者更小,只有到等高线与目标函数的曲线相切的时候,可能取得最优值,如下图所示,即等高线和目标函数的曲线在该点的法向量必须有相同方向,所以最优值必须满足: f(x) 的梯度 = λ∗g(x) 的梯度, λ 是常数,表示左右两边同向。这个等式就是 L(λ,x) 对参数求导的结果。
可参考:[深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT条件](http://blog.csdn.net/xianlingmao/article/details/7919597) ***设拟合直线是 y=a+bx ,距离(或误差)为 di=yi−(a+bx) ,那么最小二乘的思想就是让等式
还有重积分,向量的导数等等知识点以后学到了再去看吧,突然发现大学的时候只记得公式,具体的为什么很多都不是很清楚,还有很多的几何意义也似懂非懂,慢慢再补吧,继续补下去感觉出不来了。接下来开始看线性代数吧。
附上: 希腊字母表(配读音)
序号 | 大写 | 小写 | English | 发音 | 中文 | 含义 |
---|---|---|---|---|---|---|
1 | Α | α | alpha | a:lf | 阿尔法 | |
2 | Β | β | beta | bet | 贝塔 | |
3 | Γ | γ | gamma | ga:m | 伽马 | |
4 | Δ | δ | delta | delt | 德尔塔 | δ: delta value,偏差值 |
5 | Ε | ε | epsilon | ep’silon | 伊普西龙 | |
6 | Ζ | ζ | zeta | zat | 截塔 | |
7 | Η | η | eta | eit | 艾塔 | |
8 | Θ | θ | thet | θit | 西塔 | |
9 | Ι | ι | iot | aiot | 约塔 | |
10 | Κ | κ | kappa | kap | 卡帕 | |
11 | ∧ | λ | lambda | lambd | 兰布达 | |
12 | Μ | μ | mu | mju | 缪 | |
13 | Ν | ν | nu | nju | 纽 | |
14 | Ξ | ξ | xi | ksi | 克西 | ξ: slack variable,松弛变量 |
15 | Ο | ο | omicron | omik’ron | 奥密克戎 | |
16 | ∏ | π | pi | pai | 派 | π: 圆周率 |
17 | Ρ | ρ | rho | rou | 肉 | |
18 | ∑ | σ | sigma | ‘sigma | 西格马 | |
19 | Τ | τ | tau | tau | 套 | |
20 | Υ | υ | upsilon | jup’silon | 宇普西龙 | |
21 | Φ | φ | phi | fai | 佛爱 | |
22 | Χ | χ | chi | phai | 凯 | |
23 | Ψ | ψ | psi | psai | 普西 | |
24 | Ω | ω | omega | o’miga | 欧米伽 |