深度学习的基础 - 导数是什么 - 微分是什么 - 导数和微分有什么区别 - 微分解决什么问题

导数是什么 - 微分是什么 - 导数和微分有什么区别 - 微分解决什么问题

flyfish

柯西和维尔斯特拉斯时代的极限微积分

无穷数列

我们先从无穷说起。
怎么理解无穷?
我们的分析是在标准分析范围内,如果是非标准分析又是另一套方法
2 \sqrt{2} 2 说起
相同的两个数相乘,结果是2

一个数和自己相乘结果是2,那么这个数是多少呢?根据这个问题了解无穷小数是怎样产生的,从而了解无穷的样子。

因为
1 2 = 1 1 ^2 =1 12=1 1 小 于 2 1小于2 12
2 2 = 4 2 ^2 =4 22=4 4 大 于 2 4大于2 42,
所以
这个小数肯定在 1 和 2 1和2 12之间。

如果一一计算是 1. 1 2 1.1^2 1.12 , 1. 2 2 1.2^2 1.22, 1. 3 2 1.3^2 1.32,一直到 1. 9 2 1.9^2 1.92
因为
1. 4 2 = 1.96 1.4^2 =1.96 1.42=1.96, 1.96 小 于 2 1.96小于2 1.962
1.52 = 2.25 1.5 2 =2.25 1.52=2.25, 2.25 大 于 2 2.25大于2 2.252
所以肯定在 1.4 和 1.5 1.4和1.5 1.41.5之间。
所以小数展开一定是以 1.4 1.4 1.4开头

现在假设已经以此方法算出的数字是1.4142135。那么可以继续往下计算

1.4142135 0 2 = 1.9999998236822500 1.4142135 1 2 = 1.9999998519665201 1.4142135 2 2 = 1.9999998802507904 1.4142135 3 2 = 1.9999999085350609 1.4142135 4 2 = 1.9999999368193316 1.4142135 5 2 = 1.9999999651036025 1.4142135 6 2 = 1.9999999933878736 1.4142135 7 2 = 2.000000022 \begin{array}{l} 1.41421350^{2}=1.9999998236822500 \\ 1.41421351^{2}=1.9999998519665201 \\ 1.41421352^{2}=1.9999998802507904 \\ 1.41421353^{2}=1.9999999085350609 \\ 1.41421354^{2}=1.9999999368193316 \\ 1.41421355^{2}=1.9999999651036025 \\ 1.41421356^{2}=1.9999999933878736 \\ 1.41421357^{2}=2.000000022 \end{array} 1.414213502=1.99999982368225001.414213512=1.99999985196652011.414213522=1.99999988025079041.414213532=1.99999990853506091.414213542=1.99999993681933161.414213552=1.99999996510360251.414213562=1.99999999338787361.414213572=2.000000022

这样我们得到下一位数字是6。

这样的计算永远无法结束

是什么让我们能够相信存在这样的一个无穷小数 X 2 = 2 X^2 =2 X2=2呢?
我们下面的规律

1 2 = 1 1. 4 2 = 1.96 1.4 1 2 = 1.9881 1.41 4 2 = 1.999396 1.414 2 2 = 1.99996164 1.4142 1 2 = 1.9999899241 1.41421 3 2 = 1.999998409469 1.414213 5 2 = 1.99999982368225 1.4142135 6 2 = 1.9999999933878736 \begin{array}{c} 1^{2}=1 \\ 1.4^{2}=1.96 \\ 1.41^{2}=1.9881 \\ 1.414^{2}=1.999396 \\ 1.4142^{2}=1.99996164 \\ 1.41421^{2}=1.9999899241 \\ 1.414213^{2}=1.999998409469 \\ 1.4142135^{2}=1.99999982368225 \\ 1.41421356^{2}=1.9999999933878736 \end{array} 12=11.42=1.961.412=1.98811.4142=1.9993961.41422=1.999961641.414212=1.99998992411.4142132=1.9999984094691.41421352=1.999999823682251.414213562=1.9999999933878736

先确定个概念,因数和积,用于我们后面的表达。
10(因数) ×20(因数) = 200(积)
我们根据上面的列表看到因数的小数位数越多,结果积的小数点后面的数字9就越多。因此,如果把该列表永远的写下去,那么后面的9有无穷多位。这样我们感知到了无穷。
那么问题又来了。
1.99999999…(9无限循环)等于2吗?

极限

2 \sqrt{2} 2 表示为有理数组成的无穷数列,不只一种方法表示。
不足近似值构成的无穷数列
{ 1.4 , 1.41 , 1.414 , … } \{1.4,1.41,1.414,…\} {1.4,1.41,1.414,}
过剩近似值构成的无穷数列
{ 1.5 , 1.42 , 1.415 , … } \{1.5,1.42,1.415,…\} {1.5,1.42,1.415,}

我们再来看 1.99999999 … 和 2 1.99999999…和2 1.999999992的问题
我们可以看成数列
{ 1.9 , 1.99 , 1.999 , … } \{1.9,1.99,1.999,…\} {1.9,1.99,1.999,}

{ 2 , 2 , 2 , 2 , … } \{2,2,2,2,…\} {2,2,2,2,}
这两个数列都收敛于2

于是我们可以这样写 { 1.9 , 1.99 , 1.999 , … } = { 2 , 2 , 2 , 2 , … } \{1.9,1.99,1.999,…\}=\{2,2,2,2,…\} {1.9,1.99,1.999,}={2,2,2,2,}
简写
1.99999999 … = 2 1.99999999… = 2 1.99999999=2
1.99999999 … 1.99999999… 1.99999999看作有理数列 1.9 , 1.99 , 1.999 , … {1.9,1.99,1.999,…} 1.9,1.99,1.999,,其极限是2
2 , 2 , 2 , 2 , … {2,2,2,2,…} 2,2,2,2,的极限也是2,他们两个叫等价类

思考过程是 数列-》极限

导数和微分 在不同时期有不同的定义
三种微积分
牛顿和莱布尼茨时代的微积分称之为古典微积分
柯西和维尔斯特拉斯时代的微分称为极限微积分
20世纪60年代鲁滨逊时期的微积分在非标准分析中。
教科书高等数学用的是极限微积分。

古典微积分是上存在bug的,而且是引发第二次数学危机的问题。我们先从严谨的极限微积分说起,在反过来说古典微积分的问题出在什么地方。关于导数和微分这两种微积分中是谁是基础的问题
在极限微积分中先有极限再有导数后有微分。先有导数再有切线。
数列-》极限-》导数-》微分
导数-》切线

导数,切线,微分都体现在下图中
深度学习的基础 - 导数是什么 - 微分是什么 - 导数和微分有什么区别 - 微分解决什么问题_第1张图片

导数

先看导数的定义,再解释
按照《同济大学数学系列教材高等数学上册》导数的定义如下,为了符合图上的字母,我只是把 x 0 x_0 x0换成了 a a a

设函数 y = f ( x ) y=f(x) y=f(x)在点 a a a的某个邻域内有定义,当 x x x a a a
处增量为 △ x ( a + △ x \triangle x(a+\triangle x x(a+x仍在该邻域内)时,相应的函数取得增量 △ y = f ( a + Δ x ) − f ( a ) \triangle y=f\left(a+\Delta x\right)-f\left(a\right) y=f(a+Δx)f(a).如果 lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 f ( a + Δ x ) − f ( a ) Δ x \lim _{\Delta x \rightarrow 0} \frac{\Delta y}{\Delta x}=\lim _{\Delta x \rightarrow 0} \frac{f\left(a+\Delta x\right)-f\left(a\right)}{\Delta x} Δx0limΔxΔy=Δx0limΔxf(a+Δx)f(a)
存在,则称该极限为 y = f ( x ) y=f(x) y=f(x)在点 a a a
处的导数,记为
f ′ ( a ) , y ′ ∣ x = a , d y d x ∣ x = a , d f ( x ) d x ∣ x = a f^{\prime}\left(a\right),\left.y^{\prime}\right|_{x=a},\left.\left.\frac{d y}{d x}\right|_{x=a}, \frac{d f(x)}{d x}\right|_{x=a} f(a),yx=a,dxdyx=adxdf(x)x=a
也称函数 y = f ( x ) y=f(x) y=f(x)在点 a a a处可导。
可以下列形式表达
(1)
f ′ ( a ) = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 f ( a + Δ x ) − f ( a ) Δ x f^{\prime}\left(a\right)=\lim _{\Delta x \rightarrow 0} \frac{\Delta y}{\Delta x}=\lim _{\Delta x \rightarrow 0} \frac{f\left(a+\Delta x\right)-f\left(a\right)}{\Delta x} f(a)=Δx0limΔxΔy=Δx0limΔxf(a+Δx)f(a)
(2)
f ′ ( a ) = lim ⁡ h → 0 f ( a + h ) − f ( a ) h f^{\prime}\left(a\right)=\lim _{h \rightarrow 0} \frac{f\left(a+h\right)-f\left(a\right)}{h} f(a)=h0limhf(a+h)f(a)
(3)
f ′ ( a ) = lim ⁡ x → a f ( x ) − f ( a ) x − a f^{\prime}\left(a\right)=\lim _{x \rightarrow a} \frac{f(x)-f\left(a\right)}{x-a} f(a)=xalimxaf(x)f(a)

这里用的 a a a,而图上用的字母 a a a

微分

Δ y = f ( a + Δ x ) − f ( a ) = A ⋅ Δ x + o ( Δ x ) \Delta y=f\left(a+\Delta x\right)-f\left(a\right)=A \cdot \Delta x+o(\Delta x) Δy=f(a+Δx)f(a)=AΔx+o(Δx)
d y = A ⋅ Δ x d y=A \cdot \Delta x dy=AΔx

Δ y \Delta y Δy 表示成 Δ x \Delta x Δx 的线性函数, 即线性化, 从而把复杂问题化为简单问题. 即线性化, 从而把复杂问题化为简单问题. 微分就是实现这种线性化的一种数学模型.

按照上图的表示可以这样写
f ( a + d x ) ≈ f ( a ) + d y f(a+d x) \approx f(a)+d y f(a+dx)f(a)+dy
我们看看实现线性化的数学模型是怎么解决问题的

我们使用函数 f ( x ) = x + 4 f(x)=\sqrt{x+4} f(x)=x+4 来求 16.05 \sqrt{16.05} 16.05 的近似值
可以根据图上的字母来
Δ y ≈ d y \Delta y \approx d y Δydy
Δ y = f ( a + Δ x ) − f ( a ) \Delta y=f(a+\Delta x)-f(a) Δy=f(a+Δx)f(a)
f ( a + d x ) − f ( a ) ≈ d y f(a+d x)-f(a) \approx d y f(a+dx)f(a)dy
f ( a + d x ) ≈ f ( a ) + d y f(a+d x) \approx f(a)+d y f(a+dx)f(a)+dy
根据上面的式子就可以这样写

d y = f ′ ( x ) d x = 1 2 x + 4 d x  If  a = 12  and  d x = Δ x = 0.05  then  d y = 1 2 12 + 4 0.05 = 0.00625  现在,  16.05 = f ( 12.05 ) = f ( 12 + 0.05 ) ≈ f ( 12 ) + d y = 4 + 0.00625 = 4.00625 \begin{aligned} &d y=f^{\prime}(x) d x=\frac{1}{2 \sqrt{x+4}} d x\\ &\text { If } a=12 \text { and } d x=\Delta x=0.05 \text { then }\\ &d y=\frac{1}{2 \sqrt{12+4}} 0.05=0.00625\\ &\text { 现在, }\\ & \sqrt{16.05} \\ &=f(12.05)\\ &=f(12+0.05)\\ & \approx f(12)+d y \\ &= 4+0.00625=4.00625 \end{aligned} dy=f(x)dx=2x+4 1dx If a=12 and dx=Δx=0.05 then dy=212+4 10.05=0.00625 现在16.05 =f(12.05)=f(12+0.05)f(12)+dy=4+0.00625=4.00625

微分定义
设函数 y = f ( x ) y=f(x) y=f(x)定义在点 U ( x 0 ) U(x_0) U(x0)上,当给 x 0 x_0 x0一个增量 Δ x , x 0 + Δ x ∈ U ( x 0 ) \Delta x,x_0+\Delta x\in U(x_0) Δx,x0+ΔxU(x0)时,相应地得到函数增量为 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x_0+\Delta x)-f(x_0) Δy=f(x0+Δx)f(x0)

∃ A \exists A A,使得 Δ y = A Δ x + o ( Δ x ) \Delta y=A\Delta x+o(\Delta x) Δy=AΔx+o(Δx),则称函数 f f f在点 x 0 x_0 x0可微,并称 A Δ x A\Delta x AΔx f f f在点 x 0 x_0 x0的微分,记作 d y ∣ x = x 0 = A Δ x dy|_{x=x_0}=A\Delta x dyx=x0=AΔx d f ( x ) ∣ x = x 0 = A Δ x df(x)|_{x=x_0}=A\Delta x df(x)x=x0=AΔx

d y dy dy Δ x \Delta x Δx的线性函数, A ≠ 0 A\neq 0 A=0时,称微分 d y dy dy为增量 Δ y \Delta y Δy的线性主部

牛顿和莱布尼茨时代的古典微积分

该微积分是以无穷小量为基础搭建的,看上面的极限微积分,基础的定义没有无穷小量的影子。
关于无穷小量这可是引发第二次数学危机的问题
1734年,英国著名的唯心主义哲学家贝克莱主教(Bishop George Berkeley,1685~1753)发现了一个问题
贝克莱说你看这个式子,你要计算 y = f ( x ) = x 2 y=f(x)=x^{2} y=f(x)=x2的导数
Δ y Δ x = f ( x + Δ x ) − f ( x ) Δ x = ( x + Δ x ) 2 − x 2 Δ x = x 2 + 2 x ∙ Δ x + ( Δ x ) 2 − x 2 Δ x = 2 x + Δ x \begin{aligned} \frac{\Delta y}{\Delta x} &=\frac{f(x+\Delta x)-f(x)}{\Delta x}=\frac{(x+\Delta x)^{2}-x^{2}}{\Delta x} \\ &=\frac{x^{2}+2 x \bullet \Delta x+(\Delta x)^{2}-x^{2}}{\Delta x} \\ &=2 x+\Delta x \end{aligned} ΔxΔy=Δxf(x+Δx)f(x)=Δx(x+Δx)2x2=Δxx2+2xΔx+(Δx)2x2=2x+Δx
牛顿你的无穷小量 Δ x \Delta x Δx先不是0,最后那一步 Δ x = 0 \Delta x=0 Δx=0,求得导数为 2 x 2x 2x
大主教贝克莱说你这个无穷小一会儿是0一会儿不是0,我已经被你们数学家绕晕了,你们没说法,那我就叫它幽灵。你牛顿和莱布尼茨解释解释这个bug你怎么修复。
贝克莱以渺小的哲学家之名出版了一本书,标题很长,不一般的长,题目是《分析学家;或一篇致一位不信神数学家的论文,其中审查一下近代分析学的对象、原则及论断是不是比宗教的神秘、信仰的要点有更清晰的表达,或更明显的推理》。
题目是不是太长了,为什么不起的短一点。
主要还是我们翻译的问题,没有处理,直译的。
我们看其他外文书籍的直译,《国富论》全名是《国民财富的性质和原因的研究》,
《物种起源》全名《论依据自然选择即在生存斗争中保存优良族的物种起源》题目长这是有传统的。
那牛顿是如何回答大主教贝克莱的?牛顿说:你说啥,我听不见。
因为牛顿虽然曾试图通过完善自己的理论来解决,但都没有获得完全成功。这使数学家们陷入了尴尬境地:一方面微积分确实可以解决很多问题,另一方面其自身却存在着逻辑矛盾,即“贝克莱悖论”。这一问题的提出在当时的数学界引起了一定的混乱。
贝克莱主教的问题在思想上和方法上深刻影响了近代数学的发展,由此导致了第二次数学危机的产生。
牛顿和莱布尼茨时代的大师们都有只可意会,不可言传的功夫。大家都能微积分的bug之上正常的工作。但是这个bug又修复不了。到了极限微积分,整个地基都变了,无穷小量被抛弃了。
现在教科书对无穷小量是这么说的,
定义:设f在 U ∘ ( x 0 ) U^\circ(x_0) U(x0)上有定义,若 lim ⁡ x → x 0 f ( x ) = 0 \lim\limits_{x\to x_0}f(x)=0 xx0limf(x)=0,则称函数 f ( x ) f(x) f(x)为当 x → x 0 x\to x_0 xx0时的无穷小.
也可以用 ε − δ ( e p s i l o n , d e l t a ) ε-δ( epsilon,delta) εδ(epsilondelta)语言描述。
在鲁滨逊的非标准分析中,无穷小量又回到了微积分中。

你可能感兴趣的:(深度学习基础,导数,微分,无穷小量,极限,切线)