泰勒展开式(Taylor Expansion)是用多项式逼近复杂函数的一种数学工具,其核心思想是将一个光滑函数在某一点附近展开为无限项幂级数的和。具体形式如下:
设函数 f ( x ) f(x) f(x) 在点 a a a 处无限可导,则 f ( x ) f(x) f(x) 在 a a a 点的泰勒级数为:
f ( x ) = ∑ n = 0 ∞ f ( n ) ( a ) n ! ( x − a ) n f(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!} (x-a)^n f(x)=n=0∑∞n!f(n)(a)(x−a)n
其中:
当 a = 0 a = 0 a=0 时,泰勒展开式简化为麦克劳林展开式:
f ( x ) = ∑ n = 0 ∞ f ( n ) ( 0 ) n ! x n f(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(0)}{n!} x^n f(x)=n=0∑∞n!f(n)(0)xn
实际计算中常截取前 N N N 项(泰勒多项式),误差由余项表示:
R N ( x ) = f ( x ) − ∑ n = 0 N f ( n ) ( a ) n ! ( x − a ) n R_N(x) = f(x) - \sum_{n=0}^{N} \frac{f^{(n)}(a)}{n!} (x-a)^n RN(x)=f(x)−n=0∑Nn!f(n)(a)(x−a)n
常见的余项形式有拉格朗日余项:
R N ( x ) = f ( N + 1 ) ( ξ ) ( N + 1 ) ! ( x − a ) N + 1 , ξ 介于 a 和 x 之间。 R_N(x) = \frac{f^{(N+1)}(\xi)}{(N+1)!} (x-a)^{N+1}, \quad \xi \text{ 介于 } a \text{ 和 } x \text{ 之间。} RN(x)=(N+1)!f(N+1)(ξ)(x−a)N+1,ξ 介于 a 和 x 之间。
通过泰勒展开,复杂的函数可被简化为多项式形式,便于分析和计算。
导数的本质是线性逼近,这一观点是微积分的核心思想之一。为了理解这一点,我们需要从单变量函数推广到多变量函数,逐步分析导数如何通过线性映射(即矩阵)来近似复杂的变化。
对于单变量函数 f : R → R f: \mathbb{R} \to \mathbb{R} f:R→R,导数 f ′ ( a ) f'(a) f′(a) 在点 a a a 处的几何意义是函数图像的切线斜率。
线性逼近公式:
f ( a + h ) ≈ f ( a ) + f ′ ( a ) ⋅ h (当 h → 0 ) . f(a + h) \approx f(a) + f'(a) \cdot h \quad \text{(当 } h \to 0 \text{)}. f(a+h)≈f(a)+f′(a)⋅h(当 h→0).
这里 f ( a ) + f ′ ( a ) ⋅ h f(a) + f'(a) \cdot h f(a)+f′(a)⋅h 是一个线性函数(一次多项式),它给出了 f f f 在 a a a 附近的最佳线性近似。
为什么是“最佳”?
误差项 ϵ ( h ) = f ( a + h ) − [ f ( a ) + f ′ ( a ) h ] \epsilon(h) = f(a+h) - [f(a) + f'(a)h] ϵ(h)=f(a+h)−[f(a)+f′(a)h] 满足 lim h → 0 ϵ ( h ) h = 0 \lim_{h \to 0} \frac{\epsilon(h)}{h} = 0 limh→0hϵ(h)=0,即误差比 h h h 更快趋近于零。
对于多变量函数 F : R n → R m \mathbf{F}: \mathbb{R}^n \to \mathbb{R}^m F:Rn→Rm,其变化率需要用矩阵(雅可比矩阵)来描述,因为输入和输出都是多维的。
线性逼近的动机:
在点 a ∈ R n \mathbf{a} \in \mathbb{R}^n a∈Rn 附近,我们希望找到一个线性映射 L : R n → R m L: \mathbb{R}^n \to \mathbb{R}^m L:Rn→Rm(即矩阵),使得:
F ( a + h ) ≈ F ( a ) + L ⋅ h (当 ∥ h ∥ → 0 ) . \mathbf{F}(\mathbf{a} + \mathbf{h}) \approx \mathbf{F}(\mathbf{a}) + L \cdot \mathbf{h} \quad \text{(当 } \|\mathbf{h}\| \to 0 \text{)}. F(a+h)≈F(a)+L⋅h(当 ∥h∥→0).
这里的 L L L 就是雅可比矩阵 J F ( a ) J_{\mathbf{F}}(\mathbf{a}) JF(a)。
数学定义:
若存在矩阵 J F ( a ) J_{\mathbf{F}}(\mathbf{a}) JF(a) 使得:
lim ∥ h ∥ → 0 ∥ F ( a + h ) − F ( a ) − J F ( a ) ⋅ h ∥ ∥ h ∥ = 0 , \lim_{\|\mathbf{h}\| \to 0} \frac{\|\mathbf{F}(\mathbf{a} + \mathbf{h}) - \mathbf{F}(\mathbf{a}) - J_{\mathbf{F}}(\mathbf{a}) \cdot \mathbf{h}\|}{\|\mathbf{h}\|} = 0, ∥h∥→0lim∥h∥∥F(a+h)−F(a)−JF(a)⋅h∥=0,
则称 F \mathbf{F} F 在 a \mathbf{a} a 处可微,且 J F ( a ) J_{\mathbf{F}}(\mathbf{a}) JF(a) 是其导数(即雅可比矩阵)。
导数的线性性源于以下两个关键性质:
例子:
设 F ( x , y ) = ( x 2 , x y ) \mathbf{F}(x, y) = (x^2, xy) F(x,y)=(x2,xy),在点 ( 1 , 1 ) (1, 1) (1,1) 处的雅可比矩阵为:
J = [ 2 x 0 y x ] ∣ ( 1 , 1 ) = [ 2 0 1 1 ] . J = \begin{bmatrix} 2x & 0 \\ y & x \end{bmatrix}\bigg|_{(1,1)} = \begin{bmatrix} 2 & 0 \\ 1 & 1 \end{bmatrix}. J=[2xy0x] (1,1)=[2101].
对微小变化 h = ( 0.1 , 0.1 ) \mathbf{h} = (0.1, 0.1) h=(0.1,0.1),线性逼近给出:
F ( 1 + 0.1 , 1 + 0.1 ) ≈ F ( 1 , 1 ) + J ⋅ [ 0.1 0.1 ] = ( 1 , 1 ) + ( 0.2 , 0.2 ) = ( 1.2 , 1.2 ) . \mathbf{F}(1+0.1, 1+0.1) \approx \mathbf{F}(1,1) + J \cdot \begin{bmatrix} 0.1 \\ 0.1 \end{bmatrix} = (1,1) + (0.2, 0.2) = (1.2, 1.2). F(1+0.1,1+0.1)≈F(1,1)+J⋅[0.10.1]=(1,1)+(0.2,0.2)=(1.2,1.2).
实际值为 ( 1.21 , 1.21 ) (1.21, 1.21) (1.21,1.21),误差为高阶小量。
导数作为线性逼近,本质是一阶泰勒展开的矩阵形式:
F ( a + h ) = F ( a ) + J F ( a ) ⋅ h + 高阶项 . \mathbf{F}(\mathbf{a} + \mathbf{h}) = \mathbf{F}(\mathbf{a}) + J_{\mathbf{F}}(\mathbf{a}) \cdot \mathbf{h} + \text{高阶项}. F(a+h)=F(a)+JF(a)⋅h+高阶项.
高阶项(如海森矩阵对应的二次项)在 ∥ h ∥ → 0 \|\mathbf{h}\| \to 0 ∥h∥→0 时逐渐消失。
如果需要更具体的例子或数学证明,可以进一步探讨!