机器学习数学基础:2.连续性与导数

函数连续性、瞬时速度、导数相关知识

一、函数连续性

(一)函数在某点连续的条件

  • 有定义:函数在点 x 0 x_0 x0处要有明确、确定的值 f ( x 0 ) f(x_0) f(x0)。例如, f ( x ) = 1 x f(x)=\frac{1}{x} f(x)=x1 x = 0 x = 0 x=0处无定义,不满足此条件,所以在 x = 0 x = 0 x=0处不连续。
  • 极限存在:当 x x x x 0 x_0 x0左侧( x → x 0 − x \to x_0^{-} xx0)和右侧( x → x 0 + x \to x_0^{+} xx0+)趋近于 x 0 x_0 x0时,函数 f ( x ) f(x) f(x)的极限值都存在且相等。如 f ( x ) = { x + 1 , x < 0 0 , x = 0 x − 1 , x > 0 f(x)=\begin{cases}x + 1, & x < 0 \\ 0, & x = 0 \\ x - 1, & x > 0\end{cases} f(x)= x+1,0,x1,x<0x=0x>0 x → 0 − x \to 0^{-} x0时, lim ⁡ x → 0 − f ( x ) = 1 \lim_{x \to 0^{-}} f(x)=1 limx0f(x)=1 x → 0 + x \to 0^{+} x0+时, lim ⁡ x → 0 + f ( x ) = − 1 \lim_{x \to 0^{+}} f(x)= -1 limx0+f(x)=1,左右极限不等, lim ⁡ x → 0 f ( x ) \lim_{x \to 0} f(x) limx0f(x)不存在,该函数在 x = 0 x = 0 x=0处不连续。
  • 极限值等于函数值:即便函数在点 x 0 x_0 x0处有定义且极限存在,但极限值不等于该点函数值,函数在该点也不连续。比如 f ( x ) = { x 2 − 1 x − 1 , x ≠ 1 0 , x = 1 f(x)=\begin{cases}\frac{x^2 - 1}{x - 1}, & x \neq 1 \\ 0, & x = 1\end{cases} f(x)={x1x21,0,x=1x=1,当 x ≠ 1 x \neq 1 x=1时, f ( x ) = x + 1 f(x)=x + 1 f(x)=x+1 lim ⁡ x → 1 f ( x ) = 2 \lim_{x \to 1} f(x)=2 limx1f(x)=2,而 f ( 1 ) = 0 f(1)=0 f(1)=0,极限值与函数值不同,所以函数在 x = 1 x = 1 x=1处不连续。只有同时满足这三个条件,函数在点 x 0 x_0 x0处才连续。

(二)间断点

  • 定义:函数 f ( x ) f(x) f(x)在点 x = x 0 x = x_0 x=x0处不连续,则称 x 0 x_0 x0为函数的间断点。

二、瞬时速度

(一)平均速度

速度 v = s ( 路程 ) t ( 时间 ) v = \frac{s(\text{路程})}{t(\text{时间})} v=t(时间)s(路程),这是我们熟知的平均速度计算公式,表示在一段时间内物体移动的路程与所用时间的比值。例如,一辆汽车在 2 2 2小时内行驶了 100 100 100公里,那么它的平均速度就是 v = 100 2 = 50 v = \frac{100}{2} = 50 v=2100=50公里/小时,这意味着在这 2 2 2小时的整个过程中,汽车平均每小时行驶 50 50 50公里。

(二)瞬时经过路程

Δ s = s ( t 0 + Δ t ) − s ( t 0 ) \Delta s = s(t_0 + \Delta t) - s(t_0) Δs=s(t0+Δt)s(t0)。这里的 s ( t ) s(t) s(t)表示物体在时刻 t t t的路程, t 0 t_0 t0是一个特定的时刻, Δ t \Delta t Δt是一个很小的时间间隔。这个公式的含义是,在从时刻 t 0 t_0 t0开始经过 Δ t \Delta t Δt这么一小段时间后,物体所经过的路程变化量就是 Δ s \Delta s Δs。比如,一个物体的路程函数是 s ( t ) = t 2 s(t) = t^2 s(t)=t2,在 t 0 = 2 t_0 = 2 t0=2秒时,经过 Δ t = 0.1 \Delta t = 0.1 Δt=0.1秒,那么 Δ s = s ( 2 + 0.1 ) − s ( 2 ) = ( 2 + 0.1 ) 2 − 2 2 = 0.41 \Delta s = s(2 + 0.1) - s(2) = (2 + 0.1)^2 - 2^2 = 0.41 Δs=s(2+0.1)s(2)=(2+0.1)222=0.41米,这就是在这 0.1 0.1 0.1秒内物体经过的路程。

(三)这一小段的平均速度

v ‾ = Δ s Δ t = s ( t 0 + Δ t ) − s ( t 0 ) Δ t \overline{v} = \frac{\Delta s}{\Delta t} = \frac{s(t_0 + \Delta t) - s(t_0)}{\Delta t} v=ΔtΔs=Δts(t0+Δt)s(t0)。它是用刚才计算出的路程变化量 Δ s \Delta s Δs除以对应的时间间隔 Δ t \Delta t Δt,得到的就是在这一小段时间 Δ t \Delta t Δt内的平均速度。还是以上面物体路程函数 s ( t ) = t 2 s(t) = t^2 s(t)=t2为例,当 t 0 = 2 t_0 = 2 t0=2秒, Δ t = 0.1 \Delta t = 0.1 Δt=0.1秒时, v ‾ = 0.41 0.1 = 4.1 \overline{v} = \frac{0.41}{0.1} = 4.1 v=0.10.41=4.1米/秒,这就是在 2 2 2秒到 2.1 2.1 2.1秒这一小段时间内的平均速度。

(四)瞬时速度

Δ t → 0 \Delta t \to 0 Δt0时,刚才计算的这一小段的平均速度 v ‾ \overline{v} v就趋近于瞬时速度了,即 v ( t 0 ) = lim ⁡ Δ t → 0 v ‾ = lim ⁡ Δ t → 0 Δ s Δ t = lim ⁡ Δ t → 0 s ( t 0 + Δ t ) − s ( t 0 ) Δ t v(t_0) = \lim\limits_{\Delta t \to 0} \overline{v} = \lim\limits_{\Delta t \to 0} \frac{\Delta s}{\Delta t} = \lim\limits_{\Delta t \to 0} \frac{s(t_0 + \Delta t) - s(t_0)}{\Delta t} v(t0)=Δt0limv=Δt0limΔtΔs=Δt0limΔts(t0+Δt)s(t0)。这是因为瞬时速度是指物体在某一时刻的速度,当我们把时间间隔 Δ t \Delta t Δt取得越来越小,小到趋近于 0 0 0时,此时计算出的平均速度就可以近似看作是该时刻的瞬时速度。比如,对于自由落体运动,路程函数 s ( t ) = 1 2 g t 2 s(t) = \frac{1}{2}gt^2 s(t)=21gt2 g g g是重力加速度),要计算 t = 3 t = 3 t=3秒时的瞬时速度,就可以通过这个极限公式来计算,随着 Δ t \Delta t Δt趋近于 0 0 0,就能得到准确的瞬时速度值。

三、导数

(一)导数的定义

设函数 y = f ( x ) y = f(x) y=f(x)在点 x 0 x_0 x0的某一邻域内有定义。当自变量 x x x x 0 x_0 x0处取得增量 Δ x \Delta x Δx x 0 + Δ x x_0 + \Delta x x0+Δx仍在该邻域内)时,函数相应地取得增量 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y = f(x_0 + \Delta x) - f(x_0) Δy=f(x0+Δx)f(x0)

如果当 Δ x \Delta x Δx趋于 0 0 0时,增量之比 Δ y Δ x \frac{\Delta y}{\Delta x} ΔxΔy的极限存在,即左右极限都存在且相等,这里的左右极限指:

  • Δ x \Delta x Δx从大于 0 0 0的方向趋近于 0 0 0(记为 Δ x → 0 + \Delta x \to 0^{+} Δx0+)时, lim ⁡ Δ x → 0 + Δ y Δ x \lim\limits_{\Delta x \to 0^{+}}\frac{\Delta y}{\Delta x} Δx0+limΔxΔy存在;
  • Δ x \Delta x Δx从小于 0 0 0的方向趋近于 0 0 0(记为 Δ x → 0 − \Delta x \to 0^{-} Δx0)时, lim ⁡ Δ x → 0 − Δ y Δ x \lim\limits_{\Delta x \to 0^{-}}\frac{\Delta y}{\Delta x} Δx0limΔxΔy存在,并且这两个单侧极限相等。

那么就称函数 y = f ( x ) y = f(x) y=f(x)在点 x 0 x_0 x0处可导,这个极限值就称为函数 y = f ( x ) y = f(x) y=f(x)在点 x 0 x_0 x0处的导数,记作 f ′ ( x 0 ) f^{\prime}(x_0) f(x0),也就是 f ′ ( x 0 ) = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x f^{\prime}(x_0)=\lim\limits_{\Delta x \to 0}\frac{\Delta y}{\Delta x}=\lim\limits_{\Delta x \to 0}\frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} f(x0)=Δx0limΔxΔy=Δx0limΔxf(x0+Δx)f(x0)

(二)通俗理解

  • 类比速度:可以把导数想象成开车时速度表上显示的瞬时速度,它能告诉我们在某一时刻车开得有多快。对于一般的函数 y = f ( x ) y = f(x) y=f(x),它的导数 f ′ ( x ) f^\prime(x) f(x)就表示当 x x x变化一点点时, y y y变化的快慢程度。
  • 函数图像上的体现:如果把函数 y = f ( x ) y = f(x) y=f(x)的图像画出来,那么在某一点处的导数就是这一点处切线的斜率。比如说,对于函数 y = x 2 y = x^2 y=x2,它的图像是一个抛物线。在点 ( 1 , 1 ) (1,1) (1,1)处,你可以想象在这个点上画一条切线,这条切线的倾斜程度(也就是斜率)就是函数在 x = 1 x = 1 x=1处的导数。通过求导公式可以算出 y ′ = 2 x y^\prime = 2x y=2x,所以在 x = 1 x = 1 x=1时,导数 f ′ ( 1 ) = 2 f^\prime(1) = 2 f(1)=2,也就是说在点 ( 1 , 1 ) (1,1) (1,1)处切线的斜率是 2 2 2,这条切线是比较陡的。

(三)从平均变化率到导数

  • 平均变化率:先看平均变化率,就像你走一段路,用走的路程除以花费的时间,得到的就是这段时间内的平均速度,这就是一种平均变化率。对于函数 y = f ( x ) y = f(x) y=f(x),从 x 0 x_0 x0 x 0 + Δ x x_0 + \Delta x x0+Δx,函数值从 f ( x 0 ) f(x_0) f(x0)变到 f ( x 0 + Δ x ) f(x_0 + \Delta x) f(x0+Δx),那么 f ( x 0 + Δ x ) − f ( x 0 ) Δ x \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} Δxf(x0+Δx)f(x0)就是函数在区间 [ x 0 , x 0 + Δ x ] [x_0, x_0 + \Delta x] [x0,x0+Δx]上的平均变化率。
  • 趋近于导数:但是平均变化率只能反映一个区间上的大致变化情况。如果我们想知道在 x 0 x_0 x0这一个点上的变化快慢,那就得让这个区间变得非常非常小,也就是让 Δ x \Delta x Δx趋近于 0 0 0。当 Δ x \Delta x Δx趋近于 0 0 0时,这个平均变化率的极限 lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x \lim\limits_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} Δx0limΔxf(x0+Δx)f(x0)就是函数在 x 0 x_0 x0点的导数 f ′ ( x 0 ) f^\prime(x_0) f(x0)。这就好像你把时间间隔缩得极小极小,得到的就是某一瞬间的速度,也就是瞬时速度,而这个瞬时速度就是路程函数对时间的导数。

(四)正弦函数求导

  • 和角公式:我们知道正弦函数的和角公式为: sin ⁡ ( A + B ) = sin ⁡ A cos ⁡ B + cos ⁡ A sin ⁡ B \sin(A + B) = \sin A\cos B + \cos A\sin B sin(A+B)=sinAcosB+cosAsinB。那么对于 sin ⁡ ( x + Δ x ) \sin(x + \Delta x) sin(x+Δx),这里 A = x A = x A=x B = Δ x B = \Delta x B=Δx,所以 sin ⁡ ( x + Δ x ) = sin ⁡ x cos ⁡ Δ x + cos ⁡ x sin ⁡ Δ x \sin(x + \Delta x) = \sin x\cos\Delta x + \cos x\sin\Delta x sin(x+Δx)=sinxcosΔx+cosxsinΔx

  • 求平均变化率:我们要求正弦函数的导数,根据导数的定义,先求平均变化率: sin ⁡ ( x + Δ x ) − sin ⁡ x Δ x = ( sin ⁡ x cos ⁡ Δ x + cos ⁡ x sin ⁡ Δ x ) − sin ⁡ x Δ x \frac{\sin(x + \Delta x) - \sin x}{\Delta x} = \frac{(\sin x\cos\Delta x + \cos x\sin\Delta x) - \sin x}{\Delta x} Δxsin(x+Δx)sinx=Δx(sinxcosΔx+cosxsinΔx)sinx,将上式分子展开并整理可得: sin ⁡ x cos ⁡ Δ x + cos ⁡ x sin ⁡ Δ x − sin ⁡ x Δ x = sin ⁡ x ( cos ⁡ Δ x − 1 ) + cos ⁡ x sin ⁡ Δ x Δ x \frac{\sin x\cos\Delta x + \cos x\sin\Delta x - \sin x}{\Delta x} = \frac{\sin x(\cos\Delta x - 1) + \cos x\sin\Delta x}{\Delta x} ΔxsinxcosΔx+cosxsinΔxsinx=Δxsinx(cosΔx1)+cosxsinΔx

  • 分析极限:当 Δ x \Delta x Δx趋近于 0 0 0时:对于 cos ⁡ Δ x − 1 Δ x \frac{\cos\Delta x - 1}{\Delta x} ΔxcosΔx1,可以通过一些高等数学的方法(比如洛必达法则等)证明它趋近于 0 0 0;而对于 sin ⁡ Δ x Δ x \frac{\sin\Delta x}{\Delta x} ΔxsinΔx,这是一个重要的极限,它趋近于 1 1 1(在高等数学中有严格证明)。所以,当 Δ x \Delta x Δx趋近于 0 0 0时,整个式子的极限就是: lim ⁡ Δ x → 0 sin ⁡ x ( cos ⁡ Δ x − 1 ) + cos ⁡ x sin ⁡ Δ x Δ x = sin ⁡ x × 0 + cos ⁡ x × 1 = cos ⁡ x \lim\limits_{\Delta x \to 0}\frac{\sin x(\cos\Delta x - 1) + \cos x\sin\Delta x}{\Delta x} = \sin x\times0 + \cos x\times1 = \cos x Δx0limΔxsinx(cosΔx1)+cosxsinΔx=sinx×0+cosx×1=cosx,这就得到了 ( sin ⁡ x ) ′ = cos ⁡ x (\sin x)^\prime = \cos x (sinx)=cosx

  • 理解平均速度的几何意义

    • 平均速度 v ‾ = Δ s Δ t = s ( t 0 + Δ t ) − s ( t 0 ) Δ t \overline{v}=\frac{\Delta s}{\Delta t}=\frac{s(t_0 + \Delta t) - s(t_0)}{\Delta t} v=ΔtΔs=Δts(t0+Δt)s(t0),从几何角度看, Δ s = s ( t 0 + Δ t ) − s ( t 0 ) \Delta s = s(t_0 + \Delta t) - s(t_0) Δs=s(t0+Δt)s(t0)表示这两个点在纵坐标上的差值,即两点间的“高度差”。
    • Δ t \Delta t Δt表示这两个点在横坐标上的差值,即两点间的“水平距离”。
    • 那么平均速度 v ‾ \overline{v} v就等于连接这两个点 ( t 0 , s ( t 0 ) ) (t_0, s(t_0)) (t0,s(t0)) ( t 0 + Δ t , s ( t 0 + Δ t ) ) (t_0 + \Delta t, s(t_0+\Delta t)) (t0+Δt,s(t0+Δt))的直线的斜率。
    • 例如,对于函数 s ( t ) = t 2 s(t)=t^{2} s(t)=t2,当 t 0 = 1 t_0 = 1 t0=1 Δ t = 0.5 \Delta t = 0.5 Δt=0.5时, s ( 1 ) = 1 s(1)=1 s(1)=1 s ( 1 + 0.5 ) = 2.25 s(1 + 0.5)=2.25 s(1+0.5)=2.25
    • 平均速度 v ‾ = s ( 1 + 0.5 ) − s ( 1 ) 0.5 = 2.25 − 1 0.5 = 1.25 0.5 = 2.5 \overline{v}=\frac{s(1 + 0.5)-s(1)}{0.5}=\frac{2.25 - 1}{0.5}=\frac{1.25}{0.5}=2.5 v=0.5s(1+0.5)s(1)=0.52.251=0.51.25=2.5
    • 在图像上,点 ( 1 , 1 ) (1,1) (1,1) ( 1.5 , 2.25 ) (1.5,2.25) (1.5,2.25)连线的斜率 k = 2.25 − 1 1.5 − 1 = 1.25 0.5 = 2.5 k=\frac{2.25 - 1}{1.5 - 1}=\frac{1.25}{0.5}=2.5 k=1.512.251=0.51.25=2.5,与计算出的平均速度相等。
    • 斜率描述了直线的倾斜程度,平均速度越大,这条连线就越陡峭,意味着在这段时间内物体运动得越快;平均速度越小,连线越平缓,物体运动得越慢。

(五)一元函数求导基本法则推导过程

(一)和差法则
  • 内容 [ u ( x ) ± v ( x ) ] ′ = u ′ ( x ) ± v ′ ( x ) [u(x) \pm v(x)]^\prime = u^\prime(x) \pm v^\prime(x) [u(x)±v(x)]=u(x)±v(x)
  • 推导过程
    根据导数的定义 f ′ ( x ) = lim ⁡ Δ x → 0 f ( x + Δ x ) − f ( x ) Δ x f^\prime(x)=\lim\limits_{\Delta x \to 0}\frac{f(x + \Delta x)-f(x)}{\Delta x} f(x)=Δx0limΔxf(x+Δx)f(x),对于 [ u ( x ) + v ( x ) ] [u(x) + v(x)] [u(x)+v(x)]
    [ u ( x ) + v ( x ) ] ′ = lim ⁡ Δ x → 0 [ u ( x + Δ x ) + v ( x + Δ x ) ] − [ u ( x ) + v ( x ) ] Δ x = lim ⁡ Δ x → 0 [ u ( x + Δ x ) − u ( x ) ] + [ v ( x + Δ x ) − v ( x ) ] Δ x = lim ⁡ Δ x → 0 u ( x + Δ x ) − u ( x ) Δ x + lim ⁡ Δ x → 0 v ( x + Δ x ) − v ( x ) Δ x = u ′ ( x ) + v ′ ( x ) \begin{align*} &[u(x)+v(x)]^\prime\\ =&\lim\limits_{\Delta x \to 0}\frac{[u(x+\Delta x)+v(x+\Delta x)] - [u(x)+v(x)]}{\Delta x}\\ =&\lim\limits_{\Delta x \to 0}\frac{[u(x+\Delta x)-u(x)] + [v(x+\Delta x)-v(x)]}{\Delta x}\\ =&\lim\limits_{\Delta x \to 0}\frac{u(x+\Delta x)-u(x)}{\Delta x}+\lim\limits_{\Delta x \to 0}\frac{v(x+\Delta x)-v(x)}{\Delta x}\\ =&u^\prime(x)+v^\prime(x) \end{align*} ====[u(x)+v(x)]Δx0limΔx[u(x+Δx)+v(x+Δx)][u(x)+v(x)]Δx0limΔx[u(x+Δx)u(x)]+[v(x+Δx)v(x)]Δx0limΔxu(x+Δx)u(x)+Δx0limΔxv(x+Δx)v(x)u(x)+v(x)
    同理,对于 [ u ( x ) − v ( x ) ] [u(x)-v(x)] [u(x)v(x)]
    [ u ( x ) − v ( x ) ] ′ = lim ⁡ Δ x → 0 [ u ( x + Δ x ) − v ( x + Δ x ) ] − [ u ( x ) − v ( x ) ] Δ x = lim ⁡ Δ x → 0 [ u ( x + Δ x ) − u ( x ) ] − [ v ( x + Δ x ) − v ( x ) ] Δ x = lim ⁡ Δ x → 0 u ( x + Δ x ) − u ( x ) Δ x − lim ⁡ Δ x → 0 v ( x + Δ x ) − v ( x ) Δ x = u ′ ( x ) − v ′ ( x ) \begin{align*} &[u(x)-v(x)]^\prime\\ =&\lim\limits_{\Delta x \to 0}\frac{[u(x+\Delta x)-v(x+\Delta x)] - [u(x)-v(x)]}{\Delta x}\\ =&\lim\limits_{\Delta x \to 0}\frac{[u(x+\Delta x)-u(x)] - [v(x+\Delta x)-v(x)]}{\Delta x}\\ =&\lim\limits_{\Delta x \to 0}\frac{u(x+\Delta x)-u(x)}{\Delta x}-\lim\limits_{\Delta x \to 0}\frac{v(x+\Delta x)-v(x)}{\Delta x}\\ =&u^\prime(x)-v^\prime(x) \end{align*} ====[u(x)v(x)]Δx0limΔx[u(x+Δx)v(x+Δx)][u(x)v(x)]Δx0limΔx[u(x+Δx)u(x)][v(x+Δx)v(x)]Δx0limΔxu(x+Δx)u(x)Δx0limΔxv(x+Δx)v(x)u(x)v(x)
    综上,得到和差法则 [ u ( x ) ± v ( x ) ] ′ = u ′ ( x ) ± v ′ ( x ) [u(x) \pm v(x)]^\prime = u^\prime(x) \pm v^\prime(x) [u(x)±v(x)]=u(x)±v(x)
(二)乘积法则
  • 内容 [ u ( x ) ⋅ v ( x ) ] ′ = u ′ ( x ) ⋅ v ( x ) + u ( x ) ⋅ v ′ ( x ) [u(x)\cdot v(x)]^\prime = u^\prime(x)\cdot v(x) + u(x)\cdot v^\prime(x) [u(x)v(x)]=u(x)v(x)+u(x)v(x)

  • 推导过程
    根据导数定义 f ′ ( x ) = lim ⁡ Δ x → 0 f ( x + Δ x ) − f ( x ) Δ x f^\prime(x)=\lim\limits_{\Delta x \to 0}\frac{f(x + \Delta x)-f(x)}{\Delta x} f(x)=Δx0limΔxf(x+Δx)f(x),对于 [ u ( x ) ⋅ v ( x ) ] [u(x)\cdot v(x)] [u(x)v(x)]
    以下是乘积法则 [ u ( x ) ⋅ v ( x ) ] ′ = u ′ ( x ) ⋅ v ( x ) + u ( x ) ⋅ v ′ ( x ) [u(x)\cdot v(x)]^\prime = u^\prime(x)\cdot v(x) + u(x)\cdot v^\prime(x) [u(x)v(x)]=u(x)v(x)+u(x)v(x)更详细的推导过程:
    y = u ( x ) ⋅ v ( x ) y = u(x)\cdot v(x) y=u(x)v(x),根据导数的定义, y ′ = lim ⁡ Δ x → 0 y ( x + Δ x ) − y ( x ) Δ x y^\prime=\lim\limits_{\Delta x \to 0}\frac{y(x+\Delta x)-y(x)}{\Delta x} y=Δx0limΔxy(x+Δx)y(x),将 y = u ( x ) ⋅ v ( x ) y = u(x)\cdot v(x) y=u(x)v(x)代入可得:
    y ′ = lim ⁡ Δ x → 0 u ( x + Δ x ) ⋅ v ( x + Δ x ) − u ( x ) ⋅ v ( x ) Δ x \begin{align*} y^\prime&=\lim\limits_{\Delta x \to 0}\frac{u(x+\Delta x)\cdot v(x+\Delta x)-u(x)\cdot v(x)}{\Delta x}\\ \end{align*} y=Δx0limΔxu(x+Δx)v(x+Δx)u(x)v(x)
    为了利用 u ( x ) u(x) u(x) v ( x ) v(x) v(x)的导数,我们对分子进行巧妙的变形,添加和减去 u ( x ) v ( x + Δ x ) u(x)v(x+\Delta x) u(x)v(x+Δx),得到:
    y ′ = lim ⁡ Δ x → 0 u ( x + Δ x ) ⋅ v ( x + Δ x ) − u ( x ) ⋅ v ( x + Δ x ) + u ( x ) ⋅ v ( x + Δ x ) − u ( x ) ⋅ v ( x ) Δ x = lim ⁡ Δ x → 0 ( u ( x + Δ x ) − u ( x ) ) ⋅ v ( x + Δ x ) + u ( x ) ⋅ ( v ( x + Δ x ) − v ( x ) ) Δ x \begin{align*} y^\prime&=\lim\limits_{\Delta x \to 0}\frac{u(x+\Delta x)\cdot v(x+\Delta x)-u(x)\cdot v(x+\Delta x)+u(x)\cdot v(x+\Delta x)-u(x)\cdot v(x)}{\Delta x}\\ &=\lim\limits_{\Delta x \to 0}\frac{(u(x+\Delta x)-u(x))\cdot v(x+\Delta x)+u(x)\cdot (v(x+\Delta x)-v(x))}{\Delta x}\\ \end{align*} y=Δx0limΔxu(x+Δx)v(x+Δx)u(x)v(x+Δx)+u(x)v(x+Δx)u(x)v(x)=Δx0limΔx(u(x+Δx)u(x))v(x+Δx)+u(x)(v(x+Δx)v(x))
    将上式拆分为两项:
    y ′ = lim ⁡ Δ x → 0 [ ( u ( x + Δ x ) − u ( x ) ) ⋅ v ( x + Δ x ) Δ x + u ( x ) ⋅ ( v ( x + Δ x ) − v ( x ) ) Δ x ] \begin{align*} y^\prime&=\lim\limits_{\Delta x \to 0}\left[\frac{(u(x+\Delta x)-u(x))\cdot v(x+\Delta x)}{\Delta x}+\frac{u(x)\cdot (v(x+\Delta x)-v(x))}{\Delta x}\right]\\ \end{align*} y=Δx0lim[Δx(u(x+Δx)u(x))v(x+Δx)+Δxu(x)(v(x+Δx)v(x))]
    根据极限的四则运算法则,可进一步拆分为:
    y ′ = lim ⁡ Δ x → 0 ( u ( x + Δ x ) − u ( x ) ) ⋅ v ( x + Δ x ) Δ x + lim ⁡ Δ x → 0 u ( x ) ⋅ ( v ( x + Δ x ) − v ( x ) ) Δ x \begin{align*} y^\prime&=\lim\limits_{\Delta x \to 0}\frac{(u(x+\Delta x)-u(x))\cdot v(x+\Delta x)}{\Delta x}+\lim\limits_{\Delta x \to 0}\frac{u(x)\cdot (v(x+\Delta x)-v(x))}{\Delta x}\\ \end{align*} y=Δx0limΔx(u(x+Δx)u(x))v(x+Δx)+Δx0limΔxu(x)(v(x+Δx)v(x))
    Δ x → 0 \Delta x\to 0 Δx0时, v ( x + Δ x ) → v ( x ) v(x+\Delta x)\to v(x) v(x+Δx)v(x),根据极限的乘法法则,可得到:
    y ′ = lim ⁡ Δ x → 0 ( u ( x + Δ x ) − u ( x ) ) Δ x ⋅ lim ⁡ Δ x → 0 v ( x + Δ x ) + u ( x ) ⋅ lim ⁡ Δ x → 0 ( v ( x + Δ x ) − v ( x ) ) Δ x \begin{align*} y^\prime&=\lim\limits_{\Delta x \to 0}\frac{(u(x+\Delta x)-u(x))}{\Delta x}\cdot\lim\limits_{\Delta x \to 0}v(x+\Delta x)+u(x)\cdot\lim\limits_{\Delta x \to 0}\frac{(v(x+\Delta x)-v(x))}{\Delta x}\\ \end{align*} y=Δx0limΔx(u(x+Δx)u(x))Δx0limv(x+Δx)+u(x)Δx0limΔx(v(x+Δx)v(x))
    根据导数的定义, lim ⁡ Δ x → 0 ( u ( x + Δ x ) − u ( x ) ) Δ x = u ′ ( x ) \lim\limits_{\Delta x \to 0}\frac{(u(x+\Delta x)-u(x))}{\Delta x}=u^\prime(x) Δx0limΔx(u(x+Δx)u(x))=u(x) lim ⁡ Δ x → 0 ( v ( x + Δ x ) − v ( x ) ) Δ x = v ′ ( x ) \lim\limits_{\Delta x \to 0}\frac{(v(x+\Delta x)-v(x))}{\Delta x}=v^\prime(x) Δx0limΔx(v(x+Δx)v(x))=v(x),且 lim ⁡ Δ x → 0 v ( x + Δ x ) = v ( x ) \lim\limits_{\Delta x \to 0}v(x+\Delta x)=v(x) Δx0limv(x+Δx)=v(x),所以:
    y ′ = u ′ ( x ) ⋅ v ( x ) + u ( x ) ⋅ v ′ ( x ) y^\prime = u^\prime(x)\cdot v(x)+u(x)\cdot v^\prime(x) y=u(x)v(x)+u(x)v(x)

  • 这个推导过程的关键在于对 u ( x + Δ x ) ⋅ v ( x + Δ x ) − u ( x ) ⋅ v ( x ) u(x+\Delta x)\cdot v(x+\Delta x)-u(x)\cdot v(x) u(x+Δx)v(x+Δx)u(x)v(x)进行巧妙的变形,将其拆分成可以利用 u ( x ) u(x) u(x) v ( x ) v(x) v(x)的导数定义的形式。

  • 通过添加和减去 u ( x ) v ( x + Δ x ) u(x)v(x+\Delta x) u(x)v(x+Δx),我们把表达式转化为可以分别计算 u ( x ) u(x) u(x) v ( x ) v(x) v(x)的增量与 Δ x \Delta x Δx之比的极限的形式。

  • 最后利用极限的四则运算法则,将复杂的极限拆分为两个相对简单的极限的和,从而得到乘积法则。

Δ x → 0 \Delta x \to 0 Δx0时, v ( x + Δ x ) → v ( x ) v(x + \Delta x) \to v(x) v(x+Δx)v(x)

根据极限的四则运算法则,可得:

[ u ( x ) ⋅ v ( x ) ] ′ = lim ⁡ Δ x → 0 u ( x + Δ x ) − u ( x ) Δ x ⋅ lim ⁡ Δ x → 0 v ( x + Δ x ) + u ( x ) ⋅ lim ⁡ Δ x → 0 v ( x + Δ x ) − v ( x ) Δ x = u ′ ( x ) ⋅ v ( x ) + u ( x ) ⋅ v ′ ( x ) \begin{align*} &[u(x)\cdot v(x)]^\prime\\ =&\lim\limits_{\Delta x \to 0}\frac{u(x + \Delta x)-u(x)}{\Delta x}\cdot\lim\limits_{\Delta x \to 0}v(x + \Delta x)+u(x)\cdot\lim\limits_{\Delta x \to 0}\frac{v(x + \Delta x)-v(x)}{\Delta x}\\ =&u^\prime(x)\cdot v(x)+u(x)\cdot v^\prime(x) \end{align*} ==[u(x)v(x)]Δx0limΔxu(x+Δx)u(x)Δx0limv(x+Δx)+u(x)Δx0limΔxv(x+Δx)v(x)u(x)v(x)+u(x)v(x)

(三)商的法则
  • 内容 [ u ( x ) v ( x ) ] ′ = u ′ ( x ) v ( x ) − u ( x ) v ′ ( x ) v 2 ( x ) \left[\frac{u(x)}{v(x)}\right]^\prime=\frac{u^\prime(x)v(x)-u(x)v^\prime(x)}{v^2(x)} [v(x)u(x)]=v2(x)u(x)v(x)u(x)v(x) v ( x ) ≠ 0 v(x)\neq0 v(x)=0
  • 推导过程
    y = u ( x ) v ( x ) = u ( x ) ⋅ 1 v ( x ) y = \frac{u(x)}{v(x)} = u(x)\cdot\frac{1}{v(x)} y=v(x)u(x)=u(x)v(x)1,令 w ( x ) = 1 v ( x ) w(x)=\frac{1}{v(x)} w(x)=v(x)1,则 y = u ( x ) ⋅ w ( x ) y = u(x)\cdot w(x) y=u(x)w(x)

先对 w ( x ) = 1 v ( x ) w(x)=\frac{1}{v(x)} w(x)=v(x)1求导,根据复合函数求导法则,设 t = v ( x ) t = v(x) t=v(x),则 w ( x ) = 1 t w(x)=\frac{1}{t} w(x)=t1 w ′ ( x ) = d w d t ⋅ d t d x = − 1 t 2 ⋅ v ′ ( x ) = − v ′ ( x ) v 2 ( x ) w^\prime(x)=\frac{d w}{d t}\cdot\frac{d t}{d x}=-\frac{1}{t^2}\cdot v^\prime(x)=-\frac{v^\prime(x)}{v^2(x)} w(x)=dtdwdxdt=t21v(x)=v2(x)v(x)

再根据乘积法则对 y = u ( x ) ⋅ w ( x ) y = u(x)\cdot w(x) y=u(x)w(x)求导:

y ′ = ( u ( x ) ⋅ w ( x ) ) ′ = u ′ ( x ) ⋅ w ( x ) + u ( x ) ⋅ w ′ ( x ) = u ′ ( x ) ⋅ 1 v ( x ) + u ( x ) ⋅ ( − v ′ ( x ) v 2 ( x ) ) = u ′ ( x ) v ( x ) − u ( x ) v ′ ( x ) v 2 ( x ) \begin{align*} y^\prime&=(u(x)\cdot w(x))^\prime\\ &=u^\prime(x)\cdot w(x)+u(x)\cdot w^\prime(x)\\ &=u^\prime(x)\cdot\frac{1}{v(x)}+u(x)\cdot\left(-\frac{v^\prime(x)}{v^2(x)}\right)\\ &=\frac{u^\prime(x)v(x)-u(x)v^\prime(x)}{v^2(x)} \end{align*} y=(u(x)w(x))=u(x)w(x)+u(x)w(x)=u(x)v(x)1+u(x)(v2(x)v(x))=v2(x)u(x)v(x)u(x)v(x)

(六)求导的重要原因和用途

(一)分析函数的变化趋势
  • 单调性判断:通过求导得到导函数,根据导函数的正负可以判断原函数的单调性。当导函数大于 0 0 0时,原函数单调递增;当导函数小于 0 0 0时,原函数单调递减。例如,对于函数 y = x 2 y = x^{2} y=x2,其导数 y ′ = 2 x y^{\prime}=2x y=2x,当 x > 0 x>0 x>0时, y ′ > 0 y^{\prime}>0 y>0,函数单调递增;当 x < 0 x<0 x<0时, y ′ < 0 y^{\prime}<0 y<0,函数单调递减。
  • 极值点确定:导数为 0 0 0的点可能是函数的极值点。继续上面的例子, y = x 2 y = x^{2} y=x2,令 y ′ = 2 x = 0 y^{\prime}=2x = 0 y=2x=0,解得 x = 0 x = 0 x=0 x = 0 x = 0 x=0就是函数的一个极值点,且为极小值点。
(二)优化问题求解

在实际应用中,很多问题都涉及到求最优解,比如成本最小化、利润最大化等。以生产某种产品为例,设总成本函数为 C ( x ) C(x) C(x),其中 x x x表示产量。通过对 C ( x ) C(x) C(x)求导,找到导数为 0 0 0的点以及判断导数在该点两侧的正负变化,就能确定成本函数的最小值点,即最佳的生产产量,使得成本最低。同样,对于利润函数 P ( x ) P(x) P(x),求导分析可以帮助企业确定最佳的销售价格和产量组合,以实现利润最大化。

(三)物理意义

导数在物理学中有广泛的应用。如速度是位移对时间的导数,加速度是速度对时间的导数。已知物体的位移函数 s ( t ) s(t) s(t),对其求导可得速度函数 v ( t ) v(t) v(t),再对速度函数求导得到加速度函数 a ( t ) a(t) a(t)。在研究物体的运动状态时,这些导数关系能帮助我们深入了解物体的运动特性,例如判断物体是加速、减速还是匀速运动,以及预测物体在未来某个时刻的位置、速度等状态。又如在电学中,电流是电荷量对时间的导数,通过对电荷量随时间变化的函数求导,可以分析电路中的电流变化情况,对电路设计和故障诊断等方面提供理论支持。

(四)曲线的切线与法线

已知函数 y = f ( x ) y = f(x) y=f(x),在某一点 ( x 0 , y 0 ) (x_0, y_0) (x0,y0)处的导数 f ′ ( x 0 ) f^{\prime}(x_0) f(x0)就是曲线在该点处切线的斜率。根据直线的点斜式方程,可得切线方程为 y − y 0 = f ′ ( x 0 ) ( x − x 0 ) y - y_0 = f^{\prime}(x_0)(x - x_0) yy0=f(x0)(xx0)。而曲线在该点处的法线与切线垂直,根据两直线垂直斜率之积为 − 1 -1 1,可知法线的斜率为 − 1 f ′ ( x 0 ) -\frac{1}{f^{\prime}(x_0)} f(x0)1(前提是 f ′ ( x 0 ) ≠ 0 f^{\prime}(x_0) \neq 0 f(x0)=0),进而可写出法线方程为 y − y 0 = − 1 f ′ ( x 0 ) ( x − x 0 ) y - y_0 = -\frac{1}{f^{\prime}(x_0)}(x - x_0) yy0=f(x0)1(xx0)。这些切线和法线的知识在几何图形的分析、光学中的反射定律(光线反射时入射角与反射角的切线关系)等领域有着重要的应用。

(五)近似计算

利用导数可以进行近似计算。当 Δ x \Delta x Δx很小时,根据导数的定义有 Δ y ≈ f ′ ( x 0 ) Δ x \Delta y \approx f^{\prime}(x_0)\Delta x Δyf(x0)Δx,其中 f ′ ( x 0 ) f^{\prime}(x_0) f(x0)是函数 y = f ( x ) y = f(x) y=f(x) x 0 x_0 x0处的导数。例如,已知 4 = 2 \sqrt{4} = 2 4 =2,要求 4.02 \sqrt{4.02} 4.02 的近似值,设 f ( x ) = x f(x)=\sqrt{x} f(x)=x x 0 = 4 x_0 = 4 x0=4 Δ x = 0.02 \Delta x = 0.02 Δx=0.02,先求 f ′ ( x ) = 1 2 x f^{\prime}(x)=\frac{1}{2\sqrt{x}} f(x)=2x 1,则 f ′ ( 4 ) = 1 2 4 = 1 4 f^{\prime}(4)=\frac{1}{2\sqrt{4}}=\frac{1}{4} f(4)=24 1=41,根据近似公式可得 4.02 ≈ 2 + 1 4 × 0.02 = 2 + 0.005 = 2.005 \sqrt{4.02} \approx 2 + \frac{1}{4} \times 0.02 = 2 + 0.005 = 2.005 4.02 2+41×0.02=2+0.005=2.005。这种近似计算方法在工程计算、数值分析等领域,当对精度要求不是极高时,可以快速简便地得到近似结果,提高计算效率。

(七)常见函数求导公式的推导过程(部分):

(一)常数函数 ( C ) ′ = 0 (C)^\prime = 0 (C)=0 C C C为常数)的推导

根据导数的定义 f ′ ( x ) = lim ⁡ Δ x → 0 f ( x + Δ x ) − f ( x ) Δ x f^\prime(x)=\lim\limits_{\Delta x \to 0}\frac{f(x + \Delta x)-f(x)}{\Delta x} f(x)=Δx0limΔxf(x+Δx)f(x),对于常数函数 f ( x ) = C f(x)=C f(x)=C,则 f ( x + Δ x ) = C f(x + \Delta x)=C f(x+Δx)=C

所以 lim ⁡ Δ x → 0 C − C Δ x = lim ⁡ Δ x → 0 0 = 0 \lim\limits_{\Delta x \to 0}\frac{C - C}{\Delta x}=\lim\limits_{\Delta x \to 0}0 = 0 Δx0limΔxCC=Δx0lim0=0,即 ( C ) ′ = 0 (C)^\prime = 0 (C)=0

(二)幂函数 ( x n ) ′ = n x n − 1 (x^n)^\prime = nx^{n - 1} (xn)=nxn1 n n n为正整数)的推导(使用二项式定理)

y = x n y = x^n y=xn,根据导数定义 y ′ = lim ⁡ Δ x → 0 ( x + Δ x ) n − x n Δ x y^\prime=\lim\limits_{\Delta x \to 0}\frac{(x + \Delta x)^n - x^n}{\Delta x} y=Δx0limΔx(x+Δx)nxn

由二项式定理 ( x + Δ x ) n = x n + n x n − 1 Δ x + n ( n − 1 ) 2 ! x n − 2 ( Δ x ) 2 + ⋯ + ( Δ x ) n (x+\Delta x)^n = x^n + nx^{n - 1}\Delta x + \frac{n(n - 1)}{2!}x^{n - 2}(\Delta x)^2+\cdots+(\Delta x)^n (x+Δx)n=xn+nxn1Δx+2!n(n1)xn2(Δx)2++(Δx)n

( x + Δ x ) n − x n Δ x = x n + n x n − 1 Δ x + ⋯ + ( Δ x ) n − x n Δ x = n x n − 1 + n ( n − 1 ) 2 ! x n − 2 Δ x + ⋯ + ( Δ x ) n − 1 \frac{(x + \Delta x)^n - x^n}{\Delta x}=\frac{x^n + nx^{n - 1}\Delta x + \cdots+(\Delta x)^n - x^n}{\Delta x}=nx^{n - 1}+\frac{n(n - 1)}{2!}x^{n - 2}\Delta x+\cdots+(\Delta x)^{n - 1} Δx(x+Δx)nxn=Δxxn+nxn1Δx++(Δx)nxn=nxn1+2!n(n1)xn2Δx++(Δx)n1

Δ x → 0 \Delta x \to 0 Δx0时,后面含有 Δ x \Delta x Δx的项都趋近于 0 0 0,所以 y ′ = n x n − 1 y^\prime = nx^{n - 1} y=nxn1

(三)指数函数 ( e x ) ′ = e x (e^x)^\prime = e^x (ex)=ex的推导(使用极限定义和指数函数性质)

根据导数定义 ( e x ) ′ = lim ⁡ Δ x → 0 e x + Δ x − e x Δ x = lim ⁡ Δ x → 0 e x ( e Δ x − 1 ) Δ x (e^x)^\prime=\lim\limits_{\Delta x \to 0}\frac{e^{x + \Delta x}-e^x}{\Delta x}=\lim\limits_{\Delta x \to 0}\frac{e^x(e^{\Delta x}-1)}{\Delta x} (ex)=Δx0limΔxex+Δxex=Δx0limΔxex(eΔx1)

t = Δ x t = \Delta x t=Δx,当 Δ x → 0 \Delta x \to 0 Δx0时, t → 0 t \to 0 t0,考虑 lim ⁡ t → 0 e t − 1 t \lim\limits_{t \to 0}\frac{e^t - 1}{t} t0limtet1

通过洛必达法则,对分子分母同时求导, lim ⁡ t → 0 e t 1 = 1 \lim\limits_{t \to 0}\frac{e^t}{1}=1 t0lim1et=1

所以 ( e x ) ′ = e x lim ⁡ Δ x → 0 e Δ x − 1 Δ x = e x (e^x)^\prime = e^x\lim\limits_{\Delta x \to 0}\frac{e^{\Delta x}-1}{\Delta x}=e^x (ex)=exΔx0limΔxeΔx1=ex

(四)对数函数 ( ln ⁡ x ) ′ = 1 x (\ln x)^\prime=\frac{1}{x} (lnx)=x1 x > 0 x>0 x>0)的推导(使用导数定义和对数运算法则)

y = ln ⁡ x y = \ln x y=lnx,根据导数定义 y ′ = lim ⁡ Δ x → 0 ln ⁡ ( x + Δ x ) − ln ⁡ x Δ x = lim ⁡ Δ x → 0 ln ⁡ x + Δ x x Δ x = lim ⁡ Δ x → 0 ln ⁡ ( 1 + Δ x x ) Δ x y^\prime=\lim\limits_{\Delta x \to 0}\frac{\ln(x + \Delta x)-\ln x}{\Delta x}=\lim\limits_{\Delta x \to 0}\frac{\ln\frac{x + \Delta x}{x}}{\Delta x}=\lim\limits_{\Delta x \to 0}\frac{\ln(1 + \frac{\Delta x}{x})}{\Delta x} y=Δx0limΔxln(x+Δx)lnx=Δx0limΔxlnxx+Δx=Δx0limΔxln(1+xΔx)

t = Δ x x t=\frac{\Delta x}{x} t=xΔx,当 Δ x → 0 \Delta x \to 0 Δx0时, t → 0 t \to 0 t0,则原式变为 lim ⁡ t → 0 ln ⁡ ( 1 + t ) x t = 1 x lim ⁡ t → 0 ln ⁡ ( 1 + t ) t \lim\limits_{t \to 0}\frac{\ln(1 + t)}{xt}=\frac{1}{x}\lim\limits_{t \to 0}\frac{\ln(1 + t)}{t} t0limxtln(1+t)=x1t0limtln(1+t)

根据等价无穷小,当 t → 0 t \to 0 t0时, ln ⁡ ( 1 + t ) ∼ t \ln(1 + t)\sim t ln(1+t)t,所以 lim ⁡ t → 0 ln ⁡ ( 1 + t ) t = 1 \lim\limits_{t \to 0}\frac{\ln(1 + t)}{t}=1 t0limtln(1+t)=1,则 ( ln ⁡ x ) ′ = 1 x (\ln x)^\prime=\frac{1}{x} (lnx)=x1

以下是求极值点的常见情况和方法:

(八)利用导数求极值点

  1. 函数可导的情况
    • 求一阶导数并找驻点:对函数 f ( x ) f(x) f(x)求一阶导数 f ′ ( x ) f^\prime(x) f(x),令 f ′ ( x ) = 0 f^\prime(x)=0 f(x)=0,解出的 x x x值即为驻点。例如,对于函数 f ( x ) = x 3 − 3 x 2 + 2 f(x)=x^3 - 3x^2 + 2 f(x)=x33x2+2 f ′ ( x ) = 3 x 2 − 6 x f^\prime(x)=3x^2 - 6x f(x)=3x26x,令 f ′ ( x ) = 0 f^\prime(x)=0 f(x)=0,即 3 x ( x − 2 ) = 0 3x(x - 2)=0 3x(x2)=0,解得 x = 0 x=0 x=0 x = 2 x = 2 x=2,这两个点就是驻点。
    • 利用二阶导数判断驻点性质
      • 求出函数的二阶导数 f ′ ′ ( x ) f^{\prime\prime}(x) f′′(x),将驻点代入二阶导数。
      • 如果 f ′ ′ ( x 0 ) > 0 f^{\prime\prime}(x_0)>0 f′′(x0)>0,则 x 0 x_0 x0是函数的极小值点;例如函数 f ( x ) = x 2 f(x)=x^2 f(x)=x2 f ′ ( x ) = 2 x f^\prime(x)=2x f(x)=2x,驻点 x = 0 x = 0 x=0 f ′ ′ ( x ) = 2 f^{\prime\prime}(x)=2 f′′(x)=2 f ′ ′ ( 0 ) = 2 > 0 f^{\prime\prime}(0)=2>0 f′′(0)=2>0,所以 x = 0 x = 0 x=0是极小值点。
      • 如果 f ′ ′ ( x 0 ) < 0 f^{\prime\prime}(x_0)<0 f′′(x0)<0,则 x 0 x_0 x0是函数的极大值点;例如函数 f ( x ) = − x 2 f(x)=-x^2 f(x)=x2 f ′ ( x ) = − 2 x f^\prime(x)=-2x f(x)=2x,驻点 x = 0 x = 0 x=0 f ′ ′ ( x ) = − 2 f^{\prime\prime}(x)=-2 f′′(x)=2 f ′ ′ ( 0 ) = − 2 < 0 f^{\prime\prime}(0)=-2<0 f′′(0)=2<0,所以 x = 0 x = 0 x=0是极大值点。
      • 如果 f ′ ′ ( x 0 ) = 0 f^{\prime\prime}(x_0)=0 f′′(x0)=0,则二阶导数判别法失效,需要进一步分析驻点左右两侧一阶导数的符号变化来判断。例如函数 f ( x ) = x 3 f(x)=x^3 f(x)=x3 f ′ ( x ) = 3 x 2 f^\prime(x)=3x^2 f(x)=3x2,驻点 x = 0 x = 0 x=0 f ′ ′ ( x ) = 6 x f^{\prime\prime}(x)=6x f′′(x)=6x f ′ ′ ( 0 ) = 0 f^{\prime\prime}(0)=0 f′′(0)=0,此时观察 f ′ ( x ) = 3 x 2 f^\prime(x)=3x^2 f(x)=3x2,当 x < 0 x<0 x<0时, f ′ ( x ) > 0 f^\prime(x)>0 f(x)>0;当 x > 0 x>0 x>0时, f ′ ( x ) > 0 f^\prime(x)>0 f(x)>0,说明函数在 x = 0 x = 0 x=0两侧都是单调递增的, x = 0 x = 0 x=0不是极值点。
  2. 函数不可导的情况
    • 有些函数在某些点不可导,但这些点也可能是极值点。例如函数 f ( x ) = ∣ x ∣ f(x)=|x| f(x)=x,在 x = 0 x = 0 x=0处不可导,但 x = 0 x = 0 x=0是函数的极小值点。此时需要通过分析函数在该点附近的单调性来判断。当 x < 0 x<0 x<0时, f ( x ) = − x f(x)=-x f(x)=x,函数单调递减;当 x > 0 x>0 x>0时, f ( x ) = x f(x)=x f(x)=x,函数单调递增,所以 x = 0 x = 0 x=0是极小值点。
(一)利用函数的单调性求极值点
  1. 确定函数定义域:先明确函数的定义域。
  2. 分析单调性:通过分析函数在定义域内的单调性来确定极值点。如果函数在某区间单调递增,在另一个区间单调递减,那么单调性改变的点可能是极值点。例如函数 f ( x ) = 1 x f(x)=\frac{1}{x} f(x)=x1,定义域为 x ≠ 0 x\neq0 x=0,当 x < 0 x<0 x<0时,函数单调递减;当 x > 0 x>0 x>0时,函数单调递减,在定义域内没有极值点。
(二)利用函数的图像求极值点
  1. 绘制函数图像:对于一些简单函数,可以通过绘制其大致图像来直观地观察极值点的位置。例如二次函数 y = a x 2 + b x + c y = ax^2 + bx + c y=ax2+bx+c a ≠ 0 a\neq0 a=0),其图像是抛物线,根据 a a a的正负可以确定抛物线的开口方向,进而找到顶点(即极值点)。

你可能感兴趣的:(机器学习数学基础,机器学习,概率论,人工智能)