熬了几个通宵,终于把初中到大学的数学知识梳理完了(学习算法必备数学知识)

作者简介:阿里巴巴高级技术专家,一直关注前端和机器学习邻域相关技术,在知乎和微信公众号的“全栈深入”分享深度硬核技术文章。

在机器学习的过程中,用到了很多算法知识,而算法中用到很多推导和计算,涉及到很多初中数学、高中数学、高等数学中的知识。在市面的机器学习书籍中,往往最基础的代数运行、多项式运算、函数等没有涉及,这对很多毕业多年的人来说或数学基础不好的人来说,在学习的过程中并不是很顺畅。而市面也没有一本数学大全将不同的数学知识涵盖起来。因此,笔者梳理了人民教育出版社的初中数学、高中数学,同济大学出版的高等数学中算法学习相关的16个知识点,方便学习和复习。关注 全栈深入 公众号并发送 数学 到聊天窗口下载初中数学合集,高中数学合集PDF。

数学包括对数量(数论/算术)、结构(代数)、空间(几何)、变化(分析)的研究,还包括逻辑、集合、应用数学等的研究。

01、初中数学 - 数论中的数学概念

  • 整数:正整数,0,负整数统称为整数
  • 分数:正分数,负分数统称为分数
  • 有理数:整数和分数统称为有理数(rational number)
  • 相反数:正负的两个数互为相反数(opposite number)
  • 倒数:一个数x与其相乘为1的数,记为1/x,其中x!=0
  • 无理数:无限不循环小数叫无理数,包括正负无理数,如很多数的平方根或立方根是无理数。如$\sqrt 2, \sqrt[3] {3}$。
  • 实数:有理数 + 无理数统称为实数。包括正实数 + 负实数。对应平面上的横轴。
  • 虚数:将偶指数幂是负数的数定义为纯虚数(形如a+bxi的数,其中a,b是实数,且b≠0,i²=-1。a为实部,b为虚部),虚数无算术根。对应平面上的纵轴。
  • 复数:实数 + 虚数称为复数。
    熬了几个通宵,终于把初中到大学的数学知识梳理完了(学习算法必备数学知识)_第1张图片

02、初中数学 - 整式乘法

1、多项式相乘

多项式与多项式相乘,先用一个多项式的每一项乘另一个多项式的每一项,再把所得的积相加。

$(a+b)(p+q)=a(p+q) + b(p+q)$

$\Rightarrow ap + aq + bp + bq$

2、平方差公式

formula for the difference of squares:两个数的和与两个数的差的积,等于这两个数的平方差。

$(a+b)(a-b) = a^2-b^2$

3、平方和公式

formula for the square of the sum:两个数的和(或差)的平方,等于他们的平方和,加上(或减去)它们积的2倍。

$(a+b)^2 = a^2+2ab+b^2$
$(a-b)^2 = a^2-2ab+b^2$

4、因式分解

$a^2-b^2 = (a+b)(a-b)$
$a^2+2ab+b^2 = (a+b)^2$
$a^2-2ab+b^2 = (a-b)^2$

03、初中数学 - 一元二次方程

$ax^2 + bx = - c$
$\Rightarrow x^2 + \frac b a x = - \frac c a$
$\Rightarrow x^2 + \frac b a x + (\frac {b} {2a})^2 = - \frac c a + (\frac {b} {2a})^2$
$\Rightarrow (x + \frac {b} {2a})^2 = \frac {b^2-4ac} {4a^2}$
$\Rightarrow x =\pm \sqrt {\frac {b^2-4ac} {4a^2}} - \frac {b} {2a}$
$\Rightarrow x=-b \pm \frac {\sqrt {b^2-4ac} } {2a}$
$\Rightarrow 得到两个不相等的实根:x1=-b + \frac {\sqrt {b^2-4ac} } {2a} , \;\; x2=-b - \frac {\sqrt {b^2-4ac} } {2a}$

04、初中数学 - 多项式

Polynomial,由称为未知数的变量和称为系数的常数通过有限次加减法、乘法以及自然数幂次的乘方运算得到的代数表达式。

单项式:仅由一项构成的多项式称为单项式
常数项:一项中不含未知数

示例
$x^{2} + 3x -4$ 为三项一元二次多项式
$x^{3} + 2y^2 -4z$ 为三项三元三次多项式

应用
1、多项式的加减乘除
2、多项式的矩阵乘除
3、因式分解
4、多项式方程、函数

05、高中数学 - 集合

把对象称为元素(element),把元素组成的总体叫集合,简称集(set)。如果两个集合的元素相同则两个集合相等。

  • a属于集合记为:$a \in A$
  • a不属于集合B记为:$a \notin B$

1、集合的表示

列举法:把集合里的所有元素一一列举出来,并用 {} 括起来表示集合的方法。如:{a,b}
描述法:无法用列举法表示的无穷个元素的集合,利用集合中元素的共同特征来表示的方法。如:$\{x \in R | x <10\}$


2、集合的关系

1)子集
对于两个集合A和B,如果集合A中任意一个元素都是B中的元素,则称集合A为B的子集。记作:$A \subseteq B$ 或 $B \supseteq A$

韦恩图(Venn):平面上封闭曲线的内部代表集合。

子集韦恩图:

2)真子集
如果集合 $A \subseteq B$,但存在元素 $ x \in B$,且 $ x \notin A$,则称集合A是集合B的真子集(proper subset)。记作:$A \subseteqq B$ 或 $A \supseteqq B$

3)空集
不包含任何元素的集合叫空集(empty set)。记作:$\varnothing$


3、集合的基本运算

1)并集
由所属集合A及所属集合B的元素组成的集合,称为集合A与B的并集(union set),记作:$A \cup B$。即:$A \cup B = \{x | x \in A, 或 x \in B \}$

2)交集
由属于集合A且属于集合B的元素组成的集合,称为集合A与B的交集(intersection set),记作:$A \cap B$。即:$A \cap B = \{x | x \in A, 且 x \in B \}$

3)全集
一个集合包含研究问题中涉及的所有元素,则该集合为全集(universe set),记作U。

4)补集
对于一个集合,由全集U中不属于集合A的所有元素组成的集合称为集合A相对于全集U的补集(complementary set),记作:$C_{U}A$,即:$C_{U}A = \{x | x \in U, 且 x \notin A \}$

06、高中数学 - 充要条件

1、真命题

若p,则q,即由p可以推出q,记作:$p \Rightarrow q$。

  • p是q的充分条件(sufficient condition)
  • q是p的必要条件(necessary condition)

2、假命题

若p,不能得出q,即由p不能得出结论q。记作:$p \nRightarrow q$

3、逆命题

“若p,则q” 中的条件p和结论q互换,得到一个新的命题 “若q,则p”,则该命题为原命题的逆命题。

4、充要条件

“若p,则q” 中的条件p和结论q互换,得到一个新的命题 “若q,则p”,均为真命题,即:$p \Leftarrow q$,又 $q \Rightarrow p$,记作:$ p \Leftrightarrow q$。

此时 p即是q的充要条件,也是q的必要条件,则说p是q的充分必要条件,简称充要条件(sufficient adn necessary condition)

5、全称量词

短语 “所有的”、“任意一个” 在逻辑中通常叫做全称量词(universal proposition)。用符号:$\forall$ 表示。

含有全称量词的命题称为全称量词命题(universal proposition)。

对于M中任意一个x, p(x)成立,记作:$\forall x \in M, p(x)$

6、存在量词

短语 “存在一个”,“至少有一个”在逻辑中通常叫做存在量词(existential quantifier),用符号:$\exists$ 表示。

含有存在量词的命题称为存在量词命题(existential proposition)。

存在M中的元素x,p(x)成立,记作:$\exists x \in M, p(x)$

7、全称量词的否定

$\forall x \in M, p(x)$
否定:
$\exists x \in M, \lnot p(x)$

8、存在量词的否定

$\exists x \in M, p(x)$
否定:
$\forall x \in M, \lnot p(x)$

07、高中数学 - 函数

函数是刻画变量之间对应关系的数学模型和工具。

设A,B是非空的实数集,如果对于集合A中的任意一个数x,按照某种确定的对应关系 f, 在集合B中都有唯一确定的数y和它对应,则称f: $a \rightarrow B$为从集合A到B的一个函数(function)。记作:$y=f(x), x \in A$

其中:

  • x:自变量
  • x的取值范围叫做函数的定义域(domain)
  • 与x值对应的y值叫做函数值,也是函数的值域(range)。即$\{f(x)|x \in A\}$

1、开闭区间

研究函数时常会用到区间的概念,设a,b是两个实数,而且a

(1)满足不等式a≤x≤b的实数x的集合叫做闭区间,表示为[a,b]
(2)满足不等式a(3)满足不等式a≤x

实数a与b都叫做相应区间的端点这些区间的几何表示如下所示,在数轴表示时,用实心点表示包括在区间内的端点,用空心点表示不包括在区间内的端点。实数集R可以用区间表示为(-∞,+∞),"∞”读作"无穷大”,"-∞”读作"负无穷大”,”读作"正无穷大”

2、函数的表示

坐标线

3、单调性与最大值、最小值

  • 单调性:利用函数图像研究函数值随自变量的增大而增大(或减少)的性质叫函数的单调性。
  • 单调递增:设函数f(x)的定义域为I ,区间D是I的真子集。如果Vx1,x2∈D,当x1 < x2时, 都有 f(x1) < f(x2),那么就称函数f(x)在区间D上单调递增。
  • 增函数:当函数f(x)在它的定义域上单调递增时,我们就称它是增函数(increase function)
  • 单调递减:设函数f(x)的定义域为I ,区间D是I的真子集。如果Vx1,x2∈D,当x1 > x2时, 都有 f(x1) > f(x2),那么就称函数f(x)在区间D上单调递减。
  • 减函数:当函数f(x)在它的定义域上单调递减时,我们就称它是减函数(increase function)
  • 单调区间:如果函数y=f(x)在区间D上单调递增或单调递减, 那么就说函数y=f(x)在这一区间具有(严格的)单调性,区间D叫做y=f(x)的单调区间
  • 最大值:
    设函数y=f(x)的定义域为I,如果存在实数M满足 (1)Vx∈I ,都有f(x)≤M; (2)彐x0∈I,使得f(x0)=M 则M是函数y=f(x)的最大值( maximum value).
  • 最小值:
    设函数y=f(x)的定义域为I,如果存在实数M满足 (1)Vx∈I ,都有f(x)>=M; (2)彐x0∈I,使得f(x0)=M 则M是函数y=f(x)的最小值( minimum value).

4、奇偶性

  • 偶函数(even function):设函数f(x)的定义域为I,如果Vx∈I,都有-x∈I, 且f(-x)=f(x),那么函数f(x)就叫做偶函数(even function).
  • 奇函数(odd function):设函数f(x)的定义域为I, 如果x∈I,都有一x∈I, 且f(-x)=-f(x), 那么函数f(x)就叫做奇函数( odd function)

08、高中数学 - 幂函数

形如 $y=x^a$的函数,都是以幂的底数为自变量,指数为常数,这些函数称为幂函数(power function)

09、高中数学 - 指数函数

1、n次方根

如果 $x^n=a$,则x叫做a的n次方根,其中n>1且$n\in N$。a的n次方根用符号:$\sqrt[n]{a}$ 表示

根式:$\sqrt[n]{a}$叫根式(radical),n为根指数,a叫被开n次方。

n为奇数、偶数时n次方根计算:

  • 当n是奇数时, 正数的n次方根是一个正数, 负数的n次方根是一个负数. 这时, a的n次方根用符号表示 $\sqrt[n] a$.
  • 当n是偶数时, 正数的n次方根有两个,这两个数互为相反数. 正数a的正的n次方根用符号 $\sqrt[n] a$ 表示, 负的n次方根用符号— $\sqrt[n] a$.表示, 正的n次方根与负的n次方根可以合并写成± $\sqrt[n] a$ (a>0).

负数没有偶次方根
0的任何次方根都是0,记作0=0.

性质

  1. $(\sqrt[n]{a})^n = a$
  2. $\sqrt[n]{a^m} = a^{\frac {m} {n}} (a>0, m,n \in N, n>1)$
  3. $\frac {1} {\sqrt[n]{a^m}} = a^{-\frac {m} {n}} (a>0, m,n \in N, n>1)$
  4. 0的正分数指数幂为0,0的负分数指数幂没有意义
  5. $a^ra^s = a^{r+s} (a>0, r,s \in R)$
  6. $(a^r)^s = a^{rs} (a>0, r,s \in R)$
  7. $(ab)^r = a^{r}b^{r} (a>0, b>0, r\in R)$

2、指数函数

1、指数函数
函数$y=a^x(a>0且a\neq 1)$叫指数函数(exponential function),其中x为自变量,定义域为R。

1) 函数y=a(a>0,且a≠1)的图象.由于底数a可取大于0且不等于1的所有实数,所以不妨用一端圆定于y轴的水平线段PA的长度来表示底数a的值, 即点A的横坐标xA显示的就是a的取值

2) 如图1,从左向右拖动点A(01),如图2,图象发生了变化

2、指数函数乘除
同底数幂相除,底数不变,指数相减。
$a^m \div a^n = a^{m-n}$

同底数幂相乘,底数不变,指数相加。
$a^m \times a^n = a^{m+n}$

10、高中数学 - 对数函数

如果 $a^x=N(a>0且a \neq 1)$,那么数x叫做以a为底N的对数(logarithm),记作:$x=log_{a}N$。其中a为对数的底数,N为真数。

  • 常用对数:common logarithm, 以10为底的对数,即$log_{10}N$,简写为:$lgN$
  • 自然对数:natural logarithm, 以科技、经济、生活中常用的无理数e=2.71828..为底数的对象,即$log_{e}N = lnN$(N>0)
  • 计算机以2为底的对数:$log_{2}N = lgN$

1、指数与对数的关系

$a^x = N \Leftrightarrow x=log_{a}N (其中a>0且a \neq 1)$

2、对数规则

  • 负数与0没有对数
  • $log_{a}1=0, log_{a}a=1$

3、对数的性质

1) $log_{a}(MN) = log_{a}M + log_{a}N$ 推导过程见高一上Page127

2) $log_{a}\frac M N = log_{a}M - log_{a}N$

3) $log_{a}M^n = nlog_{a}M \;\; (n \in R)$

4、对数的运算

对数换底公式:$log_{a}b = \frac {log_{c}b} {log_{c}a} \;\; (a>0且a \neq 1; b>0;c>0且c \neq 1)$

5、对数函数

函数$y=log_{a}x \;\;(a>0且a\neq1)叫对数函数(logarithmic function),x为自变量,定义域为(0,+\infty)$

6、对象的性质

11、高中数学 - 反函数

$x=log_{a}b,y \in (0,1] 是函数 y=a^{x},x \in \[0, + \infty)$ 的反函数。基定义域互换。

12、高中数学 - 三角函数

1、正弦函数

$y=sin x, x \in [0,2\pi]$

2、余弦函数

$y=cos x, x \in R$

3、正切函数

$y=tan x, x \in R, x \neq \frac {\pi} {2} + k\pi, k \in Z$

13、高中数学 - 数列

按确定顺序排列的数称为数列。用正整数表示事物发展过程的先后顺序,把正整数作为自变量的取值,把事务对应数值看作是相应的函数值,数列是定义在正整数集上的一类离散函数。

  • 数列形式:a1, a2, a3, ..., an 简记为: $\{a_{n}\}$

因为:$\{a_{n}\}$ 中每一项${a_{n}}$和它的序号n有关系,所以数列${a_{n}}$是从正整数集N或它的子集 到 实数集R的函数,自变量为n。记为:$a_{n}=f(n)$

  • 递增数列:每一项都大于它前一项的数列
  • 递减数列:每一项都小于它前一项的数列
  • 常数列:每一项都相等的数列
  • 通项公式:数列 $\{a_{n}\}$ 的第 n 项 $a_{n}$ 与序号 n之间的对应关系可用一个式子来表示,式子即为数列的通项公式
  • 数列前$\{a_{n}\}$前n项和:$S_{n}$ = a1 + a2 + ... + an
应用
1、根据通项公式求指定项的值,并作出图像
2、根据数列前n项写出通项公式
3、根据通项公式判断指定是否为数列的项,求序号
4、斐波那契数列

1、等差数列

一个数列从第2项起,每一项与它前一项的差都等于同一个常数,就叫等差数列,常数叫的公差,常以字母 d 表示。

等差中项:在a和b间存在一个数使得 2A = a+b,则A为a和b的等差中项。

应用
1、等差数列求和,利用等差中项来计算

2、等比数列

一个数列从第2项起,每一项与它前一项的比都等于同一个常数,就叫等比数列,常数叫数列的公比,常以字母 q 表示。

等比中项:在a和b间存在一个数使得 G2 = ab,则G为a和b的等比中项。

等比数列前n项公式: $S_{n} = a_{1} + a_{2} + a_{3} + ..+ a_{n}$
=>由等比公式得到A式:$S_{n} =a_{1}q^0 + a_{1}q^1 + a_{1}q^2 + ..+ a_{1}q^{n-1}$
=>左右都乘以公比得到B式:$qS_{n} =a_{1}q^1 + a_{1}q^2 + a_{1}q^3 + ..+ a_{1}q^n$
=>A式B式左右相减:$(1-q)S_{n} =a_{1} + a_{1}q^n$
=>$S_{n} =a_{1}\frac {1-q^n} {1-q} (其中q!=1)$

14、高中数学 - 导数

1、微积分的创立与四类科学相关

  • 已知物体运动的路程作为时间的函数,求物体在任意时刻的速度和加速度。反之已知物体的加速度作为时间的函数,求速度与路程
  • 求曲线的切线
  • 求函数的最大值、最小值
  • 求长度、面积、体积、重心等

2、导数及应用

导数定量地刻画函数的局部变化,是研究函数增减、变化快慢、最大值、最小值等性质的基本方法,是解决如增长率、膨胀率、效率、密度、速度、加速度等实际问题的基本工具。

3、平均变化率

对于函数 $y=f(x)$,设自变量x从$x_{0}$变化到$x_{0}+\triangle x$,相应地值y就从$f(x_{0})$变化到了$f(x_{0}+\triangle x)$。此时x, y的变化量为:
$\triangle y = f(x_{0} + \triangle x) - f(x_{0})$

比值 $\frac {\triangle y} {\triangle x} = \frac {f(x_{0} + \triangle x) - f(x_{0})} {\triangle x}$ 叫做函数 $y=f(x)$从$x_{0}$到 $x_{0}+\triangle x$ 的平均变化率

4、导数

当$\triangle x \to 0$时,平均变化率 $\frac {\triangle y} {\triangle x}$ 无限趋近于一个确定的值,即 $\frac {\triangle y} {\triangle x}$ 有极限,则称 y=f(x)在 $x=x_{0}$ 处可导,并把这个确定的值叫做 $y=f(x)在x=x_{0}$ 处的导数(derivative)。也叫瞬时变化率,记作 $f'(x_{0})$ 或 $y'|_{x=x_{0}}$。即:

$\displaystyle f'(x_{0}) = \lim_{\triangle x \to 0} \frac {\triangle x} {\triangle y} = \lim_{\triangle x \to 0} \frac {f(x_{0} + \triangle x) - f(x_{0})} {\triangle x}$

5、求导数

1) 设 $f(x)=\frac 1 x $, 求$f'(1)$
解:

$\displaystyle f'(1)= \lim_{\triangle x \to 0} \frac {f(1+\triangle x)-f(1)} {\triangle x}$

$\displaystyle = \lim_{\triangle x \to 0} \frac {\frac {1} {1+\triangle x } -1} {\triangle x}$

$\displaystyle = \lim_{\triangle x \to 0} (-\frac 1 {1+\triangle x})$

$=-1$


2) 将原油精炼为汽油、柴油、塑胶等各种不同产,需要对原油进行冷却和加热。已知在x 时,原油的温度为$y=f(x)=x^2-7x+15$,(0<=x<=8)。计算第2h时第6h时原油的瞬时变化率并说明它们的意义。

解: 在第2h和第6h时,原油温度的瞬时变化率就是f'(2)和f'(6). 根据导数的定义:
$\displaystyle \frac {△y} {△x} = \frac {f(2+△x)-f(2)} {△x}$
$\displaystyle = \frac {(2+△x)^2-7(2+△x)+15-(2^2-7×2+15)} {△x}$
$\displaystyle = \frac {(4△x + (△x)^2-7△x)} {△x}$
$\displaystyle = △x - 3$

所以 $\displaystyle f'(2) = \lim_{△x \rightarrow 0} \frac {△y} {△x} = \lim_{△x \rightarrow 0}(△x-3) = -3$
同埋可得: f'(6) = 5

在第2h与第6h时,原油温度的瞬时变化率分别为-3C/h与5℃/h。说明在第2h附近,原油温度大约以3℃/h的速度下降;在第5h附近,原池温度大约以5℃/h的速率上升。一般地 f'(x0) (0≤x0≤8)反映了原油温度在时刻x0附近的变化情况


3)一辆汽车在公路上沿直线变速行驶,假设t s时汽车的速度为$y=v(t)=-t^2+6t+60$,求汽车在第2s与第6s时的瞬时加速度,并说明他们的意义。

分析: 瞬时加速度是速度关于时间的瞬时变化率, 因此在第2s与第6s时汽车的时加速度分别为v'(2), v'(6)

解: 在第2s和第6s时,汽车的瞬时加速度就是v'(2)和v'(6)

根据导数的定义

$\displaystyle \frac {△y} {△t} = \frac {v(2+△t) - v(2)} {△t}$
$\displaystyle = \frac {( 2 + △t)^2 + 6(2+△t) + 60 - (-2^2 + 6 * 2 + 60)} {△t}$
$\displaystyle = -△t + 2$

所以 $\displaystyle v'(2) = \lim_{△t \rightarrow 0} \frac {△y} {△t} = \lim_{△t \rightarrow 0} (-△t + 2) =2$

同理可得: v'(6)=-6.

在第2s与第6s时,汽车的瞬时加速度分别是2m/s^2与-6m/s^2. 说明在第2s附近汽车的速度每秒大约增加2m/s; 在第6s附近,汽车的速度每秒大约减少6m/s

6、导数的运算

1、常用函数的导数

1)$y=f(x)=c$
$\Rightarrow \frac {\triangle y} {\triangle x} = \frac {f(x+\triangle x) - f(x)} {\triangle x} = \frac {c-c} {\triangle x} = 0$

2)$y=f(x)=x$
$y = \frac {△y} {△x} = \frac {f(x+△x) - f(x)} {△x} = \frac {(x+△x-x)} {△x} = 1$

3)$y=f(x)=x^2$
$\displaystyle \frac {△y} {△x} = \frac {f(x+△x)-f(x)} {△x} = \frac {(x+△x)^2-x^2} {△x}$
$\displaystyle = \frac {x^2 + 2x * △x + (△x)^2 - x^2} {△x}$
$\displaystyle = 2x + △x$

所以:$\displaystyle y' = \lim_{△x \rightarrow 0} \frac {△y} {△x} = \lim_{△x \rightarrow 0} (2x + △x) = 2x$

4)$y=f(x)=\frac 1 x$
$\displaystyle \frac {△y} {△x} = \frac {f(x+△x) - f(x)} {△x} = \frac 1 {x+△x - 1/x } {△x}$
$\displaystyle = \frac {x - (x + △x)} {x (x + △x) △x} = - \frac 1 {x^2 + x * △x}$

$\displaystyle y' = \lim_{△x \rightarrow 0} \frac {△y} {△x} = \lim_{△x \rightarrow 0} \frac {- 1} {x^2 + x * △x} = - \frac 1 {x^2}$

5)$y=f(x)=\sqrt x$
$\displaystyle = \frac {△y} {△x} = \frac {f(x+△x) - f(x)} {△x}$
$\displaystyle \frac {\sqrt {x+△x} - \sqrt x} {△x} = \frac 1 {\sqrt {x+△x} + \sqrt x}$

所以 $\displaystyle y' = \lim_{△x \rightarrow 0} \frac {△y} {△x} = \lim_{△x \rightarrow 0} \frac 1 {\sqrt {x+△x} + \sqrt x} = \frac 1 {2\sqrt x}$

2、基本初等函数的导数公式
基本初等函数的导数公式

  1. 若f(x)=c(c为常数),则f'(x)=0
  2. 若f(x)=x(n∈Q),则f'(x)=nx^(n-1)
  3. 若f(x)=sinx,则f'(x)=cosx
  4. 若f(x)=cosx,则f'(x)=-sinx
  5. 若f(x)=a^x,则f'(x)=a^x lna;
  6. 若f(x)=e^x,则f'(x)=e^x;
  7. 若f(x)=loga x,则f'(x)=1 / (xlna)
  8. 若f(x)=lnx,则f'(x)=1/x
练习
1) 求函数的导数:$y=x^3-2x+3$
$y'=(x^3-2x+3)' = (x^3)' - (2x)' + (3)' = 3x^2 - 2 \times 1 + 0 = 3x^2 - 2$
2) 求函数的导数:$y=(2x+3)^2$
3) 求函数的导数:$y=e^{-0.05x+1}$
4) 求函数的导数:$y=sin(\pi x+\phi) 其中\pi和\phi为常数$

3、复合函数求导
$y=f(u)=f(g(x)) $求导:$y_x' = y_u' \times u_x'$

4、导数运算法则
导数运算法则

  • [f(x) ± g(x)]'=f'(x) ± g'(x)
  • [f(x) · g(x)]'=f'(x)g(x) + f(x)g'(x)
  • [f(x) / g(x)]'=(f'(x)g(x) - f(x)g'(x)) / [g(x)]^2 (其中g(x)≠0)

7、导数在研究函数中的应用

1、函数的单调性
在某个区间(a,b)内, 如果f'(x)>0,那么函数y=f(x)在这个区间内单调递增; 如果f'(x)<0,那么函数y=f(x)在这个区间内单调递减0

2、函数的极值与导数
求函数y=f(x)的极值的方法是:

解方程f'(x)=0. 当f(x0)=0时:
(1) 如果在x0附近的左侧f'(x)>0,右侧f'(x)<0,那么f(x0)是极大值;
(2) 如果在x0附近的左侧f'(x)<0,右侧f'(x)>0,那么f(x0)是极小值

3、生活中优化问题
导数是求函数最大值、最小会上有力的工具。

练习1:
学校或班级举行活动, 通常需要张贴海报进行宣传. 现让你设计一张如图所示的竖向张贴的海报, 要求版心面积为128dm^2, 上、下两边各空2dm, 左、右两边各空1dm. 如何设计海报的尺寸,才能使四周空白面积最小?

解法:设版心的高度为x dm,则版心的宽为 128/x dm, 四周空白面积为:S(x) = (x + 4)(128/x + 2) -128 = 2x + 512/x + 8, x>0
S'(x) = 2 - 512 /x^2 => x=+-16,舍去负数,当$x \in (0,16)$时,S'(x)<0, 当$x \in (16, +∞ )时,S'(x) > 0$

当x=16时函数S(x)的极小值点也是最小点,所版版心高为16dm,宽为8dm时,四周空白面积最小。

15、高中数学 - 定积分

1、近似替代法求曲面的面积及加速行汽车的距离。

练习1
阴影部分类似于一个梯形,但有一边是曲钱y=f(x)的一段。我们把由直线x=a, x=b(a≠b), y=0和曲线 y=f(x) 所围成的图形称为曲边梯形. 当 y= x^2, x=1, y=0时,如何计算这个曲边梯形的面积呢?

求解步骤
1)分割:将区间[0, 1]分割成n个小区间,用表达式计算每个小区间的长度△x=i/n - (i-1)/n = 1/n,面积△S ,总面积$\displaystyle S = \sum_{i=1}^n △S_i$.
2)近似替代:当n很大,△x很小时,可认为每个区间f(x)=x^2值变化很小,近似等于一个常数(可认为是左端点处的函数值y=x^2)。即用直线段近似地代替小曲边,近似可用小矩形面积代替曲边梯形面积。得到面积△S的表达式 (i-1/n)^2 * 1/n 其中i为第i个小区间,。

3)求和:通过将n段的每个△S进行相加,得到一个表达式,进行代数运算后得到总面积S一个简单的表达式 $ S \approx S_n= 1/n^3 [1^2+2^2+…+(n-1)^2] =1/3(1-1/n)(1-1/2n)$。

4)取极限:当n取无穷大时,即△x趋向于0时,得到总面S的会上为1/3

练习2
汽车以速度v作匀速直线运动时,经过时间t所行驶的路程为s=vt. 如果汽车作变速直线运动,在时刻t的速度为v(t)=-t^2+2 (t的单位:h,v的单位:km/h), 那么它在0≤t≤1这段时间内行驶的路程s(单位:km)是多少?

求解步骤:参照上个练习,得到最终答案为:$\displaystyle s \approx \lim_{n \rightarrow \infty} S_n = \lim_{n \rightarrow \infty} \sum_{n=1}^n \frac 1 n v(\frac {i-1} n) = \lim_{n \rightarrow \infty} [-1/3(1-1/n)(1-1/2n)+2] = 5/3$

2、定积分

由近似替代法求曲面的面积及加速行汽车的距离都可归结为求这种特定形式和的极限。将区间[a,b]等分成n个小区间,在每个小区间[x_i-1,x_i]上任取一点(i=1,2,…,n)作和式为:

$ \displaystyle \sum_{i=1}^n f(\epsilon_i)△x = \displaystyle \sum_{i=1}^n \frac {b-a} n f(\epsilon_i)$

当$n \rightarrow \infty$时,该和式无限接近某个常数,该常数叫做函数f(x)在区间[a,b]上的定积分(definite integral),记作:$\displaystyle \int_{a}^{b} f(x)dx = \lim_{n \rightarrow \infty} \frac {b-a} n f(\epsilon_i)$

其中:

  • a和b:积分上限和积分下限
  • 区间[a,b]:积分区间
  • 函数f(x):被积函数
  • x:积分变量
  • f(x)dx:被积式

上面曲边梯形面积定积分表示:$\displaystyle S=\int_0^1 f(x)dx = \int_0^1 x^2 dx = \frac 1 3$
几何意义:$\displaystyle S=\int_0^1 f(x)dx$ 表示由直线x=a, x=b (a!=b),y=0和曲线y=f(x)所围成的曲边梯形的面积。

上面汽车路径定积分表示:$\displaystyle S=\int_0^1 v(t)dt = \int_0^1 (-t^2+2)dt = \frac 5 3$

练习
1)计算 $\displaystyle \int_0^1 x^3 dx$的值
解题步骤:
  • 分割:区间[0,1]等分为n个区间, [i-1/n, i/n] (i=1,2,3..n),每个小区间长度△x=i/n - (i-1)/n = 1/n
  • 近似代替、作和:$\displaystyle \int_0^1 x^3 dx = S_n = \sum_{i=1}^n f(\frac i n) * \triangle x = \frac 1 4 (1+ \frac 1 n)^2$
  • 取极限:$\displaystyle \int_0^1 x^3 dx = \lim_{n \rightarrow \infty} S_n = \lim_{n \rightarrow \infty} \frac 1 4(1+ \frac 1 n)^2 = \frac 1 4$

定积分性质:

  • $\displaystyle \int_a^b kf(x)dx = \displaystyle k \int_a^b f(x)dx $ 其中k为常数
  • $\displaystyle \int_a^b [f_1(x) \pm f_2(x)] dx = \displaystyle \int_a^b f_1(x)dx \pm f_2(x)dx$
  • $\displaystyle \int_a^b f(x)dx = \displaystyle \int_a^{\epsilon} f(x)dx + \int_{\epsilon}^b f(x)dx$ 其中 $a \leq \epsilon \leq b$

16、高等数学 - 微积分

1、微积分

用定积分的定义计算$\int_0^1 x^3dx$的值比较麻烦,导数和定积分存在联系。

一个作变速直线运动的物体的运动规律是y=y(t). 由导数的概念可知,它在任意时刻t的速度v(t)=y'(t). 设这个物体在时间段[a,b]内的位移为s,你能分别用y(t),v(t)表示s吗?

解:
1)物体的位移s是函数y=y(t)在t=b处与t=a处的函数值之差,即 s=y(b)-y(a)
2) 用定积分求位移:

  • 分割
  • 近似替代、求和
  • 求极限
    得到 $\displaystyle s=\sum_{i=1}^n \triangle S_i \approx \sum_{i=1}^n h_i = \sum_{i=1}^n v(t_{i-1}) \triangle t = \sum_{i=1}^n y'(i_{i-1}) \triangle t$

n越大,△t越小,区间[a,b]划分的越细,$\sum_{i=1}^n v(t_{i-1}) \triangle t = \sum_{i=1}^n y'(i_{i-1}) \triangle t$ 与s的近似程度就越好。

3) 由定积分得到
$\displaystyle s=\lim_{n \rightarrow \infty} \sum_{i=1}^n \frac {b-a} n v(t_{i-1})$
$\displaystyle = \lim_{n \rightarrow \infty} \sum_{i=1}^n \frac {b-a} n v(t_{i-1})$
$\displaystyle = \lim_{n \rightarrow \infty} \sum_{i=1}^n \frac {b-a} n y'(t_{i-1})$
$\displaystyle = \int_a^b v(t) dt = \int_a^b y'(t) dt$

4) 由1),2)结果得到
$\displaystyle s = \int_a^b v(t) dt = \int_a^b y'(t) dt = y(b) -y(a)$

5) 微积分基本定理
fundamental theorem of calculus,(牛顿-莱布尼兹公式, Newton-Leibniz Formula).

一般地如果f(x)是区间[a,b]上的连续函数,且F'(x) = f(x),则$\displaystyle \int_a^b f(x)dx = F(b) - F(a)$,则F(b)-F(a)常记作$F(x)|_a^b$,即: $\displaystyle \int_a^b f(x)dx = F(x)|_a^b = F(b) - F(a)$

计算定积分的关键是找到满足 $F'(x) = f(x)$的函数F(x),通常可运用基本初等函数的求导公式和导数的四则运算法则从反方向上求出F(x)

练习
1、计算下列定积分
1) $\int_1^2 \frac 1 x dx$
2) $\int_1^3(2x-\frac 1 {x^2}) dx$
3) $\int_0^{\pi}sinx dx$
4) $\int_{\pi}^{2\pi} sinx dx$
5) $\int_0^{2\pi} sinx dx$


1) 因为 (lnx)' = 1/x,所以 $\int_1^2 \frac 1 x dx = lnx |_1^2 = ln2 - ln1 = ln2$

2) 因为 $(x^2)' = 2x, (- \frac 1 x)' = \frac 1 {x^2}$ , 所以 $\int_1^3(2x-\frac 1 {x^2}) dx = \int_1^3 x^2 dx - \int_1^3 \frac 1 {x^2} dx = x^2 |_1^3 -(- \frac 1 x)|_1^3 = (9-1) - (\frac 1 3 -1) = \frac 22 3$

3) $\int_0^{\pi}sinx dx = -cosx|_0^{\pi}=(-cos \pi) - (-cos 0) = -(-1) - (-1) = 2$
三角函数的定积分等于三角函数的面积

4) $\int_{\pi}^{2\pi} sinx dx = -cosx|_{\pi}^{2\pi} = (-cos 2\pi) - (-cos \pi) = (-1) - (-(-1)) = -2$

5) $\int_0^{2\pi} sinx dx = 0$


参考:基本初等函数的求导公式
  1. 若f(x)=c(c为常数),则f'(x)=0
  2. 若f(x)=x(n∈Q),则f'(x)=nx^(n-1)
  3. 若f(x)=sinx,则f'(x)=cosx
  4. 若f(x)=cosx,则f'(x)=-sinx
  5. 若f(x)=a^x,则f'(x)=a^x lna;
  6. 若f(x)=e^x,则f'(x)=e^x;
  7. 若f(x)=loga x,则f'(x)=1 / (xlna)
  8. 若f(x)=lnx,则f'(x)=1/x

2、定积分的简单应用

1、计算曲线$y^2=x, y=x^2$所围图形的面积S
解:
1) 画出草图

2) 解方程

  • $y^2=x \Rightarrow y = \sqrt x$
  • $y=x^2$

得到的解为交点的横坐标为x=0, x=1

3) 求图形面积
S = S曲边形梯形OABC - S曲边形梯形OABD = $\int_0^1 \sqrt x dx - \int_0^1 x^2 dx = \frac 2 3 x^{\frac 1 2} |_0^1 - \frac 1 3 x^3|_0^1 = \frac 1 3$

2、计算直线y=x-4, 曲线$y = \sqrt {2x}$所围图形的面积S
1) 画出草图

2) 解方程

  • $y = \sqrt {2x}$
  • $y=x-4$

直线与曲线交点的坐标为(8,4),直线与x轴交点坐标为(4,0)

3) 求图形面积
$S = S_1+S_2=\int_0^4 \sqrt {2x} dx + [ \int_4^8 \sqrt {2x} dx - \int_4^8(x-4)dx] = \frac {40} 3$

3、变速直线运动的路程
作变速直线运动的物体所经过的路程s,等于其速度函数v=v(t) (v(t)≥0)在时间区间[a,b]上的定积分 $s=\int_a^b v(t)dt$

辆汽车的速度-时间曲线如图所示,求汽车在这1min行驶的路程.

解:

3、小结

17、高等数学 - 矩阵

1、矩阵与向量

1) 矩阵
矩阵是矩形的数组。

  • 矩阵表示:$A = (a_{ij})$, 其中i=1, 2; j=1,2,3。
  • 矩阵元素表示:第i行,第j列的元素通常表示为$a_{ij}$。用大写字母表示矩阵,用小写字母表示矩阵中的元素。
  • 矩阵集合:用$R^{m \times n}$所有元素为实数的m x n矩阵集合。
  • 矩阵来自集合表示:元素来自集合S的m x n 矩阵的集合可用$S^{m \times n}$表示。

$A =\begin{bmatrix}
a_{11} & a_{12} & a_{13} \
a_{21} & a_{22} & a_{23} \
\end{bmatrix} = \begin{bmatrix}
1 & 2 & 3 \
4 & 5 & 6 \
\end{bmatrix}$

2) 矩阵转置
交换矩阵的行和列,获得的矩阵是矩阵A的转置$A^T$

$A^T = \begin{bmatrix}
a_{11} & a_{21} \
a_{12} & a_{22} \
a_{13} & a_{23} \
\end{bmatrix} = \begin{bmatrix}
1 & 4 \
2 & 5 \
3 & 6 \
\end{bmatrix}$

3) 向量
向量是一维数组。长度为n的向量称为n向量,用$x_i$表示向量中第i个元素,其中i=1,2,3..n。将向量的标准形式定义为列向量,是n x 1的矩阵,转置后是行向量。

$x = \begin{bmatrix}
2 \
3 \
5
\end{bmatrix}$

$x^T = \begin{bmatrix}
2 & 3 & 5
\end{bmatrix}$

  • 单位向量:$e_i$是除第i个元素为1,其他均为0的向量。

2、各种矩阵

  • 零矩阵:所有元素均为0的矩阵,常表示为0。
  • 方阵:正方形 n x n的矩阵
  • 对角矩阵:一个矩阵中对于任意$i \neq j$,均有$a_{ij}=0$。即非对角元素均为0。

$diag(a_{11},a_{12},...,a_{mn})= \begin{bmatrix}
a_{11} & 0 & \cdots & 0 \
0 & a_{22} & \cdots & 0 \
\vdots & \vdots & \ddots & \vdots \
0 & 0 & \cdots & a_{ij} \
\end{bmatrix}$

  • 单位矩阵:$I_n$, 对角线元素均为1的n x n对角矩阵。
    $I_n = diag(1,1,...,1)= \begin{bmatrix}
  • & 0 & \cdots & 0 \
  • & 1 & \cdots & 0 \
    \vdots & \vdots & \ddots & \vdots \
  • & 0 & \cdots & 1 \
    \end{bmatrix}$
  • 三对角矩阵:若一个矩阵满足当 |i-j|>1时$t_{ij}=0$。
  • 上三角矩阵:若一个矩阵满足对任意 i>j,有$u_{ij}=0$
  • 单位上三角矩阵:若一个上三角矩阵对角线上元素均为1
  • 下三角矩阵:若一个矩阵满足对任意 i
  • 单位下三角矩阵:若一个下三角矩阵对角线上元素均为1
  • 排列矩阵 P:若一个矩阵每行每列均有且仅有一个1,其他 位置均为0
  • 对称矩阵:若一个矩阵转置后 $A = A^T$

$A=\begin{bmatrix}
1 & 2 & 3 \
2 & 6 & 4 \
3 & 4 & 5 \
\end{bmatrix}$

3、矩阵基本操作

矩阵或向量中的元素是实数、复数、或整数取模某素数等数系中的数。

  • 矩阵加法
    如果矩阵$A=(a_{ij}), B=(b_{ij})$是m x n矩阵,两者的矩阵和是对应位置上的元素进行相加,得到的和$C = (c_{ij})=A+B$也是m x n的矩阵。即$c_{ij}=a_{ij} + b_{ij}$
零矩阵相加
是矩阵加法的单位元,A+0=0+A=A
  • 矩阵数乘
    标量倍数:$\lambda A=(\lambda a_{ij})$ 是A的标量倍数。通过将$\lambda$分别乘以每个元素。$-1 \cdot A = -A$
  • 矩阵减法
    A + (-B) = A - B
    A + (-A) = -A + A = 0
  • 矩阵乘法
    两个相容的矩阵A和B,即A的列数与B的行数相等才能相乘。$A_{m \times n}B_{n \times p} = C_{m \times p}$
    $\displaystyle c_{ij}=\sum_{k=1}^na_{ik}b_{kj}$

示例:求矩阵 $A =\begin{bmatrix}
a_{11} & a_{12} & a_{13} \
a_{21} & a_{22} & a_{23} \
\end{bmatrix}, B =\begin{bmatrix}
b_{11} & b_{12} \
b_{21} & b_{22} \
b_{31} & b_{32} \
\end{bmatrix},求C=A \times B$

计算过程
$C=A \times B=\begin{bmatrix}
a_{11} \times b_{11} + a_{12} \times b_{21} + a_{13} \times b_{31} & a_{11} \times b_{12} + a_{12} \times b_{22} + a_{13} \times b_{32}\
a_{21} \times b_{11} + a_{22} \times b_{21} + a_{23} \times b_{31} & a_{21} \times b_{12} + a_{22} \times b_{22} + a_{23} \times b_{32} \
\end{bmatrix}$


1)看紫色线
2)看绿色线
3)看蓝色线
4)看红色线


各矩阵相乘
  • 单位矩阵相乘:$I_mA=AI_n=A$
  • 零矩阵相相乘:A0=0
  • 矩阵乘法结合率:A(BC)=(AB)C
  • 矩阵乘法对加法满足分配律:A(B+C)=AB+AC。例外:n>1,n x n的矩阵乘法不满足交换律。如下:
    $A=\begin{bmatrix}
  • & 1 \
  • & 0 \
    \end{bmatrix}$

    $B=\begin{bmatrix}
  • & 0 \
  • & 0 \
    \end{bmatrix}$
    $AB=\begin{bmatrix}
  • & 0 \
  • & 0 \
    \end{bmatrix}$
    $BA=\begin{bmatrix}
  • & 0 \
  • & 1 \
    \end{bmatrix}$
  • 矩阵向量乘积:可把向量看作n x 1的矩阵相乘。

    • 内积:如果两个向量相乘,则$\displaystyle x^Ty=\sum_{i=1}^n x_i y_i$是一个1x1的矩阵,称之为x与y的内积。
    • 外积:矩阵$xy^T$是n x n的矩阵Z,称为x与y的外积。
  • 欧几里德范式:定义 n 向量x的范式 $\left \| x \right \|=(x_1^2 + x_2^2 + ... + x_n^2)^{1/2}=(x^Tx)^{1/2}$,x的范式是其在n维欧几里德空间内的长度。

4、矩阵的基本性质

1)矩阵的逆
定义 n x n的矩阵A的逆$A^{-1}$为满足$AA^{-1} = A^{-1}A= I_n$的n x n矩阵(即为原矩阵的倒数)。许多非零矩阵没有逆矩阵。
$A= \begin{bmatrix}
a & b \
c & d \
\end{bmatrix}^{-1} = \frac 1 A = \frac 1 {\begin{bmatrix}
m & n \
p & q \
\end{bmatrix}} =\begin{bmatrix}
a \times m + b \times p & a \times n + b \times q \
c \times m + d \times p & b \times n + d \times q \
\end{bmatrix}
=\begin{bmatrix}
1 & 0 \
0 & 1 \
\end{bmatrix}$

如求$\begin{bmatrix}
1 & 1 \
1 & 0 \
\end{bmatrix}^{-1} \Rightarrow \begin{bmatrix}
m+p=1 & n+q=0 \
m+0=0 & n+0=1 \
\end{bmatrix}^{-1} \Rightarrow \begin{bmatrix}
0 & 1 \
1 & -1 \
\end{bmatrix}^{-1}$

  • 可逆矩阵:若矩阵可逆则称为可逆矩阵或非奇异矩阵,如果存在则其是唯一的。
  • 不可逆矩阵:没有逆的矩阵为不可逆的或奇异的。 $(BA)^{-1}=A^{-1} b^{-1}$
  • 逆操作与转置操作可交换顺序:$(A^{-1})^T =(A^T)^{-1}$

2)矩阵的线性相关和无关

  • 线性相关:若存在不全为零的相关系数 c1,c2, ..,cn,使得$c_1x_1+c_2x_2+..+c_nx_n=0$,则称向量$x_1,x_2,..,x_n$是线性相关的。
    行向量$x_1=(1 \; 2 \; 3), x_2=(2 \; 6 \; 4), x_3=(4 \; 11 \;9)$是线性相关的,因为存在非全零$c_1, c_2, c_3$使得 $c_1x_1 + c_2x_2 + c_3x_3=0$,例如$2x_1 + 3x_2 - 2x_3=0$,即$(2, 4, 6) + (6, 18, 12) - (8, 22, 18) = 0$
  • 线性无关:不是线性相关的。单位矩阵的列向量是线性无关的。

3)矩阵的秩
对于非零 m x n的矩阵A:

  • 列秩:最大线性无关集合的大小
  • 行秩:最大线性无关集合的大小

任意矩阵A所共有的一个基本性质是A的行秩等于其列秩。简称为A的迭。
秩:非零m x n矩阵A, m x r的矩阵B,r x n的矩阵C,使得 A = BC时最小数值r是A的秩。

矩阵的秩
  • 矩阵的秩是[0, min(m, n)]内的整数
  • 零矩阵的秩是0,而n x n单位矩阵的秩是n

满秩
  • 如果 n x n方阵的秩是n,则它是满秩的。
  • 如果 m x n矩阵的秩是n,则它是列满秩的。

定理
  • 定理1:一个方阵是满秩的,当且仅当该方阵是非奇异的。
  • 定理2:一个矩阵A是列满秩的,当且仅当该矩阵不存在空向量
  • 推论3:一个方阵是奇异的,当且仅当它有空向量

4)矩阵的行列式
n x n(n>1)矩阵A的第i行j列子矩阵,是一个删除A中i行j列后得到的(n-1)x(n-1)矩阵$A_{[ij]}$。利用子矩阵递归定义该矩阵的行列式。

$
det(A) = \begin{cases}
a_{11} & \text 若n=1 \
\displaystyle \sum_{j=1}^n (-1)^{1+j} a_{1j}det(A_{[1j]}) & \text 若n>1
\end{cases}
$

$(-1)^{1+j} a_{1j}det(A_{[1j]})$为元素$a_{ij}$的代数余子式。

行列式性质
定理4:
  • 如果矩阵A中某行或某列为0,则det(A)=0
  • 当将矩阵A的任意一行(或列)的每个元素乘以$\lambda$后,A的行列式乘以$\lambda$
  • 当将矩阵A的任意一行(或列)的每个元素加到另一行(或列)的元素上,则A的行列式不变
  • 矩阵A的行列式与其转置$A^T$的行列式相等
  • 当交换A的任意两行(或两列)时,行列式改变正负号
定理5:
n x n 矩阵A是奇异的,当且仅当dt(A)=0。

正定矩阵:如果n x n矩阵A满足对于所有n向量$x \neq 0$,有$x^TAx>0$,则称A是正定的。$x^TI_nx=x^Tx = \displaystyle \sum_{i=1}^n x_i^2 > 0$

定理6:
对于任意列满秩的矩阵A,矩阵$A^TA$是正定的。

参数资料

如果你觉得这篇内容有收获,请帮我戳戳你的手指头:

1、点赞,收藏,让更多人看到。
2、关注公众号『全栈深入』,公众号后台回复 1024,送 架构师思维导图压缩包。
加我微信 stacker1024,拉你进 『全栈开发架构』群一起学习交流!

你可能感兴趣的:(算法机器学习数学)