在初学微分和导数时,虽然感觉概念不复杂,但是我对两者的关系有点模糊,比如以下问题就觉得模棱两可:
对于导数链式法则, d y d x = d y d u d u d x \frac {dy}{dx} = \frac {dy}{du} \frac {du}{dx} dxdy=dudydxdu,可以理解为约去 d u du du,所以等式相等。但假如有 F ( x , y ) , d y d x = − ∂ F / ∂ x ∂ F / ∂ y F(x,y),\frac {dy}{dx} = -\frac {\partial F / \partial x}{\partial F / \partial y} F(x,y),dxdy=−∂F/∂y∂F/∂x ,通过消去 ∂ F { \partial F} ∂F,我们是否可以推出 d y d x = − d y d x \frac {dy}{dx} = - \frac {dy}{dx} dxdy=−dxdy?
∫ a b d y d x d x    ⟹    ∫ a b d y    ⟹    y ∣ a b \int _ a^ b \frac {dy}{dx}dx \implies \int _ a^ b dy \implies y \rvert _ a^ b ∫abdxdydx⟹∫abdy⟹y∣ab,这里实实在在地消去了 d x dx dx。
d ( u v ) = ( u + d u ) ( v + d v ) − u v = u d v + v d u + d u d v d(uv)=(u+du)(v+dv)-uv=udv+vdu+dudv d(uv)=(u+du)(v+dv)−uv=udv+vdu+dudv,然后说 d u d v dudv dudv太小了,所以忽略掉,得到微分的乘法法则: d ( u v ) = u d v + v d u d(uv)=udv+vdu d(uv)=udv+vdu,难道 u d v udv udv和 v d u vdu vdu 不小?
我当时脑子一片混乱,到底 d x dx dx、 d u du du、 d v dv dv是什么东西?为什么有的地方可以消去,有的地方不可以消去?其实在各个历史时期,导数和微分的定义是不一样的,要想解答上面的疑问,还得从微积分的发展历史中寻找答案。
我尝试讲一下微积分发展的历史和数学思想,主要针对 y = f ( x ) y=f(x) y=f(x)这样的一元函数。
牛顿和莱布尼兹各自独立发明了微积分,下面我采用莱布尼兹的微积分符号进行说明(要了解各种微积分符号,可以参看维基百科。
导数不是牛顿和莱布尼兹发明的,他们之前的数学家已经对曲线的切线进行了研究。在解决曲面(一维函数是曲线,即一维曲面)下面积时,牛顿和莱布尼兹确定了导数的定义。
在微积分出现之前,曲线下的面积是一个很复杂的问题,微积分求解的主要思想是把曲线下的面积划分成无数个矩形面积之和。
直觉告诉我们,如果 n n n越大,则这个近似越准确:
这时,无穷小量 d x dx dx( Δ x \Delta x Δx是把曲线底分成n份的间隔长度)出现了。无穷小量 d x dx dx是建立微积分的基础,莱布尼兹介绍微积分的论文就叫做《论深度隐藏的几何学及无穷小与无穷大的分析》。
在当时的观点下,无穷小量 d x dx dx到底是什么也是有争论的,有数学家打比喻:“无穷小量就好比山上的灰尘,去掉和增加都没有什么影响”,很显然有人认为无穷小量 d x dx dx是真实存在的。
在具体计算曲面下面积,即我们现在所说的定积分的时候,必然会遇到导数的问题,所以很自然的开始了对导数的定义和讨论。
在曲线上取两点,连接起来,就称为曲线的割线:
割线可以反应曲线的平均变化率,也就是说这一段大概的趋势是上升还是下降,上升了多少,但是并不精确。
有了切线之后,我们进一步定义导数:
从这张图得出导数的定义: f ′ ( x ) = d y d x f'(x) =\frac{dy}{dx} f′(x)=dxdy,而 d x {dx} dx 和 d y {dy} dy 被称为 x x x 和 y y y 的微分,都是无穷小量,所以导数也被莱布尼兹称为微商(微分之商)。
上节的图实际上是矛盾的:
所以就切线的定义而言,微积分的基础就是不牢固的。
无穷小量的麻烦还远远不止这一些, x 2 x^2 x2的导数是这样计算的:
仔细看运算过程, 无穷小量$dx 先 是 在 约 分 中 被 约 掉 , 然 后 又 在 加 法 中 被 忽 略 , 也 就 是 说 先是在约分中被约掉,然后又在加法中被忽略,也就是说 先是在约分中被约掉,然后又在加法中被忽略,也就是说dx$先被当作非0的量,又被当作了0。这就是大主教贝克莱(就是在高中政治书被嘲笑的唯心主义的代表)攻击的像幽灵一样的数,一会是0一会又不是0。
无穷小量和无穷小量相除为什么可以得到不一样的值?难道不应该都是1吗?
无穷小量还违反了阿基米德公理,这个才是更严重的缺陷。康托尔证明过,如果阿基米德公理被违背的话会出大问题。
一边是看起来没有错的微积分,一边是有严重缺陷的无穷小量,这就是第二次数学危机。数学的严格性受到了挑战,“对于数学,严格性不是一切,但是没有了严格性就没有了一切”。
切线:通过割线和无穷小量定义了切线。
导数:通过切线和无穷小量定义了导数,导数是曲线在某点处切线的斜率,导数的值等于微商。
微分:微分是微小的增量,即无穷小量。
莱布尼兹、欧拉等都认识到了无穷小量导致的麻烦,一直想要拼命修补,但是这个问题到200年后,19世纪极限概念的清晰之后,才得到解决。解决办法是,完全摈弃无穷小量,基于极限的概念重新建立微积分。
现在都是用 ϵ − δ \epsilon -\delta ϵ−δ 语言描述极限:
可以看到,极限的描述并没有用到无穷小量 d x dx dx。
用极限重新严格定义,导数已经脱离了微商的概念。此时,导数应该被看成一个整体。
不过我们仍然可以去定义什么是微分。说到这里,真是有点剧情反转,古典微积分是先定义微分再有的导数,极限微积分却是先定义导数再有的微分。
从 Δ y = f ′ ( x 0 ) Δ x + a Δ x \Delta y=f'(x_0)\Delta x+a\Delta x Δy=f′(x0)Δx+aΔx得出, Δ y \Delta y Δy由两部分组成,通过图来观察一下几何意义:
d y = f ′ ( x ) Δ x dy=f'(x)\Delta x dy=f′(x)Δx,这是 d y dy dy的定义。
令函数 f ( x ) f(x) f(x)的一个函数为 y = x y = x y=x(用线性函数去逼近原函数), f ′ ( x ) = 1 f'(x) = 1 f′(x)=1, y = x    ⟹    d y = 1 Δ x    ⟹    d x = Δ x y=x \implies dy=1\Delta x\implies dx=\Delta x y=x⟹dy=1Δx⟹dx=Δx,这是 d x dx dx的定义。
最后我们得到 d y = f ′ ( x ) d x    ⟹    d y d x = f ′ ( x ) dy=f'(x)dx\implies \frac{dy}{dx}=f'(x) dy=f′(x)dx⟹dxdy=f′(x):
导数:导数被定义为一个极限,其几何意义是曲线变化率。导数值是一个常数,是一个常量。开区间内的导数值集合起来,就成为导函数。
微分:微分是函数的局部线性近似,就是一个线性函数,局部看起来很接近原函数,导数是这个线性函数的系数。其意义是变化的具体数值,是一个变量。
切线:有了导数之后,就可以确定切线。
微积分实际上被发明了两次,古典微积分和极限微积分可以说是两个东西。我们再来比较一下古典微积分和极限微积分。
古典微积分是先定义微分再定义导数,极限微积分是先定义导数再定义微分。
古典微积分的导数是基于无穷小量定义的,极限微积分的导数是基于极限定义的。
古典微积分的微分是无穷小量,极限微积分的微分是一个线性函数。
古典微积分的定积分是求无穷小矩形面积的和,极限微积分的定积分是求黎曼和。
古典微积分的切线是可以画出来的,极限微积分的切线是算出来的。
古典微积分的建立过程很直观,极限微积分的建立过程更抽象。
古典微积分最大的好处就是很直观,不过也是因为太直观了,所以我们一直都无法忘记它带来的印象,也对我们理解极限微积分造成了障碍。也让我们在实际应用中造成了错误的理解。
之前的疑惑主要是由于古典微积分带来的。
d y d x = d y d u d u d x \frac{dy}{dx}=\frac{dy}{du}\frac{du}{dx} dxdy=dudydxdu ,在古典微积分中可以理解为消去,但是在极限微积分中我们应该认识到,这两个 du 实际上是不同的函数。
∫ a b d y d x d x \int _a^ b \frac{dy}{dx}dx ∫abdxdydx古典微积分中, d x dx dx确实表明是无穷多个矩形的底边,消去也是合理的,而极限微积分中, ∫ a b d x \int _ a^ b dx ∫abdx是求黎曼和,我们可以把 ∫ a b \int _ a^ b ∫ab当作左括号, d x dx dx当作右括号,就好比 ( 2 + 6 ) = 8 (2+6)=8 (2+6)=8 ,计算完毕之后,括号自然就消失了。
d ( u v ) = ( u + d u ) ( v + d v ) − u v = u d v + v d u + d u d v d(uv)=(u+du)(v+dv)-uv=udv+vdu+dudv d(uv)=(u+du)(v+dv)−uv=udv+vdu+dudv在古典微积分中这么计算没有错误,只是 dudv 的消去也是不严谨的,而极限微积分中应该重新用极限的方法进行证明,这里不再列出。
实际上,古典微积分已经被摒弃了。我们应该重新从极限的角度去认识微积分。
我们应该从古典微积分,以直代曲、化整为零的数学思想出发去开始认识微积分。
并且,莱布尼兹一直认为数学符号应该具有启发性,他设计的微积分符号确实很符合直觉,我们可以继续借用他的符号来描述微积分。
有的数学家还是对无穷小量念念不忘,最后真的发明了既可以兼容无穷小量又不会出现问题的实数,即超实数。
基于超实数,数学家又重新定义了微积分,这次定义的微积分又很像莱布尼兹时代的微积分。这门学科被称为非标准分析(基于没有无穷小量的实数体系的微积分,就是标准分析)。
多元函数 f ( x , y ) f(x, y) f(x,y)在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)处可微(可全微分),也就是说 f ( x , y ) f(x, y) f(x,y)可以在 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)处,找到唯一的线性函数逼近,这个线性函数就叫做全微分函数。
全微分函数在分量上的系数叫做偏导数,是其一个属性。
转自知乎:微分和导数的关系是什么?两者的几何意义有什么不同?为什么要定义微分 ?