欧阳妙妙

概率论与数理统计笔记系列之第二章：随机变量及其分布

概率论与数理统计笔记（第二章随机变量及其分布）

对于统计专业来说，书本知识总有遗忘，翻看教材又太麻烦，于是打算记下笔记与自己的一些思考，主要参考用书是茆诗松老师编写的《概率论与数理统计教程》，其他知识待后续书籍补充。

文章目录

概率论与数理统计笔记（第二章随机变量及其分布）
第二章随机变量及其分布
- 2.1 随机变量及其分布
- - 2.1.1 随机变量的概念
  - 2.1.2 随机变量的分布函数
  - 2.1.3 离散随机变量的概率分布列
  - 2.1.4 连续随机变量的概率密度函数
- 2.2 随机变量的数学期望
- - 2.2.1 数学期望的概念
  - 2.2.2 数学期望的定义
  - 2.2.3 数学期望的性质
- 2.3 随机变量的方差与标准差
- - 2.3.1 方差与标准差的定义
  - 2.3.2 方差的性质
  - 2.3.3 切比雪夫不等式
- 2.4 常用离散分布
- - 2.4.1 二项分布
  - 2.4.2 泊松分布
  - 2.4 .3 超几何分布
  - 2.4.4 几何分布与负二项分布
- 2.5 常用的连续分布
- - 2.5.1 正态分布
  - 2.5.2 均匀分布
  - 2.5.3 指数分布
  - 2.5.4 伽玛分布
  - 2.5.5 贝塔分布
- 2.6 随机变量函数的分布
- - 2.6.1 离散随机变量函数的分布
  - 2.6.2 连续随机变量函数的分布
- 2.7 分布的其他特征数
- - 2.7.1 $k$ 阶矩
  - 2.7.2 变异系数
  - 2.7.3 分位数
  - 2.7.4 中位数
  - 2.7.5 偏度系数
  - 2.7.6 峰度系数

第二章随机变量及其分布

2.1 随机变量及其分布

2.1.1 随机变量的概念

定义 2.1.1
定义在样本空间 $\Omega$ 上的实值函数 $X=X(\omega)$ 称为随机变量, 常用大写字母 $X, Y, Z$ 等表示随机变量, 其取值用小写字母 $x, y, z$ 等表示. 假如一个随机变量仅可能取有限个或可列个值, 则称其为离散随机变量. 假如一个随机变量的可能取值充满数轴上的一个区间 $(a, b)$ , 则称其为连续随机变量,其中 $a$ 可以是 $-\infty, b$ 可以是 $\infty$ .

2.1.2 随机变量的分布函数

定义 2.1.2
设 $X$ 是一个随机变量, 对任意实数 $x$ , 称
$\leqslant x)$
为随机变量 $X$ 的分布函数. 且称 $X$ 服从 $F (x)$ , 记为 $\sim F(x)$ . 有时也可用 $F_x(x)$ 以表明是 $X$ 的分布函数 (把 $X$ 写成 $F$ 的下标).

定理 2.1.1 任一分布函数 $F (x)$ 都具有如下三条基本性质：
(1) 单调性 $F (x)$ 是定义在整个实数轴 $(-\infty, \infty)$ 上的单调非减函数, 即对任意的 $x_1x1<x2$

2.1.3 离散随机变量的概率分布列

对离散随机变量而言, 常用以下定义的分布列来表示其分布.
定义 2.1.3
设 $X$ 是一个离散随机变量, 如果 $X$ 的所有可能取值是 $x_1, x_2$ , $x_n, \cdots$ , 则称 $X$ 取 $x_i$ 的概率
$p_i=p\left(x_i\right)=P\left(X=x_i\right), i=1,2, \cdots, n, \cdots$
为 $X$ 的概率分布列或简称为分布列, 记为 $\sim\left\{p_i\right\}$ ,

分布列的基本性质

(1) 非负性 $p\left(x_i\right) \geqslant 0, i=1,2, \cdots$ .
(2) 正则性 $\sum_{i=1}^{\infty} p\left(x_i\right)=1$ .

以上两条基本性质是分布列必须具有的性质,也是判别某个数列是否能成为分布列的充要条件. 由离散随机变量 $X$ 的分布列很容易写出 $X$ 的分布函数
$F(x)=\sum_{x_i \le x} p\left(x_i\right) .$

2.1.4 连续随机变量的概率密度函数

定义 $2.1.4$
设随机变量 $X$ 的分布函数为 $F (x)$ , 如果存在实数轴上的一个非负可积函数 $p (x)$ , 使得对任意实数 $x$ 有
$F(x)=\int_{-\infty}^x p(t) \mathrm{d}t,$
则称 $p (x)$ 为 $X$ 的概率密度函数, 简称为密度函数, 或称密度.

密度函数的基本性质

（1）非负性 $\geqslant 0$ .
（2）正则性 $\int_{-\infty}^{\infty} p(x) \mathrm{d} x=1$ . (含有 $p (x)$ 的可积性)

以上两条基本性质是密度函数必须具有的性质, 也是确定或判别某个函数是否成为密度函数的充要条件.
除了离散分布和连续分布之外, 还有既非离㪚又非连续的分布，在此不作过多介绍。

2.2 随机变量的数学期望

2.2.1 数学期望的概念

2.2.2 数学期望的定义

定义 2.2.1
设离散随机变量 $X$ 的分布列为
$p\left(x_i\right)=P\left(X=x_i\right), i=1,2, \cdots, n, \cdots .$
如果
$\sum_{i=1}^{\infty}\left|x_i\right| p\left(x_i\right)<\infty,$
则称
$E(X)=\sum_{i=1}^{\infty} x_i p\left(x_i\right)$
为随机变量 $X$ 的数学期望, 或称为该分布的数学期望, 简称期望或均值. 若级数 $\sum_{k=1}^{\infty}\left|x_i\right| p\left(x_k\right)$ 不收敛, 则称 $X$ 的数学期望不存在.

以上定义中, 要求级数绝对收敛的目的在于使数学期望唯一. 因为随机变量的取值可正可负, 取值次序可先可后, 由无穷级数的理论知道, 如果此无穷级数绝对收敛, 则可保证其和不受次序变动的影响. 由于有限项的和不受次序变动的影响,故取有限个可能值的随机变量的数学期望总是存在的.

定义 2.2.2
设连续随机变量 $X$ 的密度函数为 $p (x)$ . 如果
$\int_{-\infty}^{\infty}|x| p(x) \mathrm{d} x<\infty,$
则称
$E(X)=\int_{-\infty}^{\infty} x p(x) \mathrm{d} x$
为 $X$ 的数学期望, 或称为该分布 $p (x)$ 的数学期望, 简称期望或均值. 若 $\int_{-\infty}^{\infty}|x| p(x) \mathrm{d} x$ 不收敛, 则称 $X$ 的数学期望不存在.

2.2.3 数学期望的性质

定理 2.2.1 若随机变量 $X$ 的分布用分布列 $p\left(x_i\right)$ 或用密度函数 $p (x)$ 表示, 则 $X$ 的某一函数 $g (X)$ 的数学期望为
$E[g(X)]=\left\{\begin{array}{l} \sum_i g\left(x_i\right) p\left(x_i\right), \text { 在离散场合 }\\ \int_{-\infty}^{\infty} g(x) p(x) \mathrm{d} x, \text { 在连续场合 } \end{array}\right.$

现基于这个定理来证明数学期望的几个常用性质, 以下均假定所涉及的数学期望是存在的.

性质 2.2.1 若 $c$ 是常数, 则 $E (c) = c$ .
性质 2.2.2 对任意常数 $a$ , 有
$E (a X) = a E (X) .$
性质 2.2.3 对任意的两个函数 $g_1(x)$ 和 $g_2(x)$ , 有
$E\left[g_1(X) \pm g_2(X)\right]=E\left[g_1(X)\right] \pm E\left[g_2(X)\right] .$

2.3 随机变量的方差与标准差

2.3.1 方差与标准差的定义

定义 2.3.1
若随机变量 $X^2$ 的数学期望 $E\left(X^2\right)$ 存在, 则称偏差平方 $(X -$ $E X)^2$ 的数学期望 $E(X-E X)^2$ 为随机变量 $X$ (或相应分布) 的方差, 记为
$\begin{aligned} \operatorname{Var}(X) &=E(X-E(X))^2 \\ &=\left\{\begin{array}{l} \sum_i\left(x_i-E(X)\right)^2 p\left(x_i\right), \text { 在离散场合, } \\ \int_{-\infty}^{\infty}(x-E(X))^2 p(x) \mathrm{d} x, \text { 在连续场合. } \end{array}\right. \end{aligned}$
称方差的正平方根 $\sqrt{\operatorname{Var}(X)}$ 为随机变量 $X$ (或相应分布)的标准差,记为 $\sigma(X)$ . 或 $\sigma_x$ .

2.3.2 方差的性质

以下均假定随机变量的方差是存在的.

性质 2.3.1 $\operatorname{Var}(X)=E\left(X^2\right)-[E(X)]^2$ .
性质 2.3.2 常数的方差为 0 , 即 $\operatorname{Var}(c)=0$ , 其中 $c$ 是常数.
性质 2.3.3 若 $a, b$ 是常数, 则 $\operatorname{Var}(a X+b)=a^2 \operatorname{Var}(X)$ .

2.3.3 切比雪夫不等式

定理 2.3.1(切比雪夫(Chebyshev, 1821-1894)不等式)
设随机变量 $X$ 的数学期望和方差都存在, 则对任意常数 $\varepsilon>0$ , 有
$\geqslant \varepsilon) \leqslant \frac{\operatorname{Var}(X)}{\varepsilon^2},$
或
$X|<\varepsilon) \geqslant 1-\frac{\operatorname{Var}(X)}{\varepsilon^2} .$

在概率论中, 事件 {| $X-E(X)|\geqslant \varepsilon\}$ 称为大偏差, 其概率 $\geqslant \varepsilon)$ 称为大偏差发生概率.

定理 2.3.2 若随机变量 $X$ 的方差存在, 则 $\operatorname{Var}(X)=0$ 的充要条件是 $X$ 几乎处处为某个常数 a，即 P(X=a)=1.（利用切比雪夫不等式）

2.4 常用离散分布

2.4.1 二项分布

一、二项分布
如果记 $X$ 为 $n$ 重伯努利试验中成功 (记为事件 $A$ ) 的次数, 则 $X$ 的可能取值为 $\cdots, n$ . 记 $p$ 为每次试验中 $A$ 发生的概率, 即 $P (A) = p$ , 则 $P(\bar{A})=1-p$ .
因为 $n$ 重伯努利试验的基本结果可以记作
$\omega=\left(\omega_1, \omega_2, \cdots, \omega_n\right) \text {, }$
其中 $\omega_i$ 或者为 $A$ , 或者为 $\bar{A}$ . 这样的 $\omega$ 共有 $2^n$ 个, 这 $2^n$ 个样本点 $\omega$ 组成了样本空间 $\Omega$ .
下面求 $X$ 的分布列, 即求事件 ${X=k\}$ 的概率. 若某个样本点
$\omega=\left(\omega_1, \omega_2, \cdots, \omega_n\right) \in|X=k|$
意味着 $\omega_1, \omega_2, \cdots, \omega_n$ 中有 $k$ 个 $A, n - k$ 个 $\bar{A}$ , 所以由独立性知,
$P(\omega)=p^k(1-p)^{n-k} \text {. }$
而事件 $∣ X = k ∣$ 中这样的 $\omega$ 共有 $\left(\begin{array}{l}n \\ k\end{array}\right)$ 个, 所以 $X$ 的分布列为
$P(X=k)=\left(\begin{array}{l} n \\k \end{array}\right) p^k(1-p)^{n-k}, k=0,1, \cdots, n .$
这个分布称为二项分布, 记为 $\sim b(n, p)$ .

二、二点分布
$n = 1$ 时的二项分布 $b (1, p)$ 称为二点分布, 或称 $0 - 1$ 分布, 或称伯努利分布, 其分布列为
$P(X=x)=p^x(1-p)^{1-x}, x=0,1 .$

二点分布 $b (1, p)$ 主要用来描述一次伯努利试验中成功 (记为 $A)$ 的次数 $(0$ 或 1).

很多随机现象的样本空间 $\Omega$ 常可一分为二, 记为 $A$ 与 $\bar{A}$ , 由此形成伯努利试验. $n$ 重伯努利试验是由 $n$ 个相同的,独立进行的伯努利试验组成, 若将第 $i$ 个伯努利试验中 $A$ 出现的次数记为 $X_i(i=1,2, \cdots, n)$ , 则 $X_i$ 相互独立, 且服从相同的二点分布 $b (1, p)$ . 此时其和
$X=X_1+X_2+\cdots+X_n$
就是 $n$ 重伯努利试验中 $A$ 出现的总次数, 它服从二项分布 $b (n, p)$ . 这就是二项分布 $b (n, p)$ 与二点分布 $b (1, p)$ 之问的联系, 即服从二项分布的随机变量是 $n$ 个独立同为二点分布的随机变量之和.

三、二项分布的数学期望和方差
设随机变量 $\sim b(n, p)$ , 则
$\begin{aligned} E(X) &=\sum_{k=0}^n k\left(\begin{array}{l} n \\ k \end{array}\right) p^k(1-p)^{k-t}=n p . \end{aligned}$
$X$ 的方差为
$\operatorname{Var}(X)=E\left(X^2\right)-(E(X))^2=n(n-1) p^2+n p-(n p)^2=n p(1-p) .$
因为二点分布是 $n = 1$ 时的二项分布 $b (1, p)$ , 所以二点分布的数学期望为 $p$ ,方差为 $p (1 - p)$ .

2.4.2 泊松分布

一、泊松分布
泊松分布是 1837 年由法国数学家泊松 (Poisson, 1781-1840) 首次提出的. 泊松分布的概率分布列是
$P(X=k)=\frac{\lambda^k}{k !} \mathrm{e}^{-\lambda}, k=0,1,2, \cdots,$
其中参数 $\lambda>0$ , 记为 $\sim P(\lambda)$ .

二、泊松分布的数学期望和方差
设随机变量 $\sim P(\lambda)$ , 则
$E(X)=\sum_{k=0}^{\infty} k \frac{\lambda^\lambda}{k !} \mathrm{e}^{-\lambda}=\lambda \mathrm{e}^{-\lambda} \sum_{k=1}^{\infty} \frac{\lambda^{i-1}}{(k-1) !}=\lambda \mathrm{e}^{-\lambda} \mathrm{e}^\lambda=\lambda .$
这表明:泊松分布 $P(\lambda)$ 的数学期望就是参数 $\lambda$ .

$\operatorname{Var}(X)=E\left(X^2\right)-(E(X))^2=\lambda^2+\lambda-\lambda^2=\lambda .$
也就是说,泊松分布 $P(\lambda)$ 中的参数 $\lambda$ 既是数学期望又是方差.

三、二项分布的泊松近似
泊松分布还有一个非常实用的特性,即可以用泊松分布作为二项分布的一种近似. 在二项分布 $b (n, p)$ 中, 当 $n$ 较大时,计算量是令人烦恼的. 而在 $p$ 较小时使用以下的泊松定理,可以减少二项分布中的计算量.

定理 2.4.1 (泊松定理) 在 $n$ 重伯努利试验中, 记事件 $A$ 在一次试验中发生的概率为 $p_n$ (与试验次数 $n$ 有关), 如果当 $\rightarrow \infty$ 时, 有 $p_n \rightarrow \lambda$ , 则
$\lim _{n \rightarrow \infty}\left(\begin{array}{l} n \\ k \end{array}\right) p_n^k\left(1-p_n\right)^{n-k}=\frac{\lambda^k}{k !} \mathrm{e}^{-\lambda} \text {. }$

由于泊松定理是在 $p_n \rightarrow \lambda$ 条件下获得的, 故在计算二项分布 $b (n, p)$ 时, 当 $n$ 很大, $p$ 很小, 而乘积 $\lambda=n p$ 大小适中时, 可以用泊松分布作近似, 即
$\left(\begin{array}{l} n \\ k \end{array}\right) p_n^k\left(1-p_n\right)^{n-k} \approx \frac{(n p)^k}{k !} \mathrm{e}^{-n p}, k=0,1,2, \cdots .$

2.4 .3 超几何分布

一、超几何分布
从一个有限总体中进行不放回抽样常会遇到超几何分布.
设有 $N$ 件产品, 其中有 $M$ 件不合格品. 若从中不放回地随机抽取 $n$ 件, 则其中含有的不合格品的件数 $X$ 服从超几何分布, 记为 $\sim h(n, N, M)$ . 超几何分布的概率分布列为
$P(X=k)=\frac{\left(\begin{array}{l} M \\ k \end{array}\right)\left(\begin{array}{l} N-M \\ n-k \end{array}\right)}{\left(\begin{array}{l} N \\ n \end{array}\right)}, k=0,1, \cdots, r .$
其中 $r=\min \{ M, n\}$ , 且 $\leqslant N, n \leqslant N, n, N, M$ 均为正整数.
超几何分布是一种常用的离散分布, 它在抽样理论中占有重要地位.

二、超几何分布的数学期望和方差
若 $\sim h(n, N, M)$ , 则 $X$ 的数学期望为
$E(X)=\sum_{k=0}^{r} k \frac{\left(\begin{array}{c} M \\ k \end{array}\right)\left(\begin{array}{c} N-M \\ n-k \end{array}\right)}{\left(\begin{array}{l} N \\ n \end{array}\right)}=n \frac{M}{N} .$
$X$ 的方差为
$\operatorname{Var}(X)=E\left(X^2\right)-[E(X)]^2=\frac{n M(N-M)(N-n)}{N^2(N-1)} .$
三、超几何分布的二项近似
当 $\ll N$ 时, 即抽取个数 $n$ 远小于产品总数 $N$ 时, 每次抽取后, 总体中的不合格品率 $p = M / N$ 改变甚微, 所以不放回抽样可近似地看成放回抽样, 这时超几何分布可用二项分布近似:
$\frac{\left(\begin{array}{l} M \\ k \end{array}\right)\left(\begin{array}{l} N-M \\ n-k \end{array}\right)}{\left(\begin{array}{l} N \\ n \end{array}\right)} \cong\left(\begin{array}{l} n \\ k \end{array}\right) p^k(1-p)^{n-k} \text {, 其中 } p=\frac{M}{N} \text {. }$

2.4.4 几何分布与负二项分布

一、几何分布
在伯努利试验序列中, 记每次试验中事件 $A$ 发生的概率为 $p$ , 如果 $X$ 为事件 $A$ 首次出现时的试验次数, 则 $X$ 的可能取值为 $\cdots$ , 称 $X$ 服从几何分布, 记为 $\sim G e(p)$ , 其分布列为
$P(X=k)=(1-p)^{k-1} p, k=1,2, \cdots .$

二、几何分布的数学期望和方差
设随机变量 $X$ 服从几何分布 $G e (p)$ , 令 $q = 1 - p$ , 利用逐项微分可得 $X$ 的数学期望为
$\begin{aligned} E(X) &=\sum_{k=1}^{\infty} k p q^{k-1}=p \sum_{k=1}^{\infty} k q^{k-1}=p \sum_{k=1}^{\infty} \frac{\mathrm{d} q^k}{\mathrm{~d} q} \\ &=p \frac{\mathrm{d}}{\mathrm{d} q}\left(\sum_{k=0}^{\infty} q^k\right)=p \frac{\mathrm{d}}{\mathrm{d} q}\left(\frac{1}{1-q}\right)=\frac{p}{(1-q)^2}=\frac{1}{p} . \end{aligned}$
$X$ 的方差为
$\operatorname{Var}(X)=E\left(X^2\right)-[E(X)]^2=\frac{2 q}{p^2}+\frac{1}{p}-\frac{1}{p^2}=\frac{1-p}{p^2} .$
从几何分布的数学期望可以看出: 投一颗骰子, 首次出现点数 6 的平均投掷次数为 6 次.

三、几何分布的无记忆性

定理 2.4.2(几何分布的无记忆性) 设 $\sim G e(p)$ , 则对任意正整数 $m$ 与 $n$ 有
$\mid X>m)=P(X>n) .$

这个定理表明: 在前 $m$ 次试验中 $A$ 没有出现的条件下, 则在接下去的 $n$ 次试验中 $A$ 仍末出现的概率只与 $n$ 青关, 而与以前的 $m$ 次试验无关, 似乎忘记了前 $m$ 次试验结果, 这就是无记忆性.

四、负二项分布
作为几何分布的一种延伸,我们注意下面的负二项分布,亦称巴斯卡分布：
在伯努利试验序列中, 记每次试验中事件 $A$ 发生的概率为 $p$ , 如果 $X$ 为事件 $A$ 第 $r$ 次出现时的试验次数, 则 $X$ 的可能取值为 $\cdots, r+m, \cdots$ . 称 $X$ 服从负二项分布或巴斯卡分布,其分布列为
$P(X=k)=\left(\begin{array}{l} k-1 \\ r-1 \end{array}\right) p^{}(1-p)^{k-r}, k=r, r+1, \cdots .$
记为 $\sim N b(r, p)$ . 当 $r = 1$ 时, 即为几何分布.
这是因为在 $k$ 次伯努利试验中, 最后一次一定是 $A$ , 而前 $k - 1$ 次中 $A$ 应出现 $r - 1$ 次, 由二项分布知其概率为 $\left(\begin{array}{c}k-1 \\ r-1\end{array}\right) p^{r-1}(1-p)^{k-r}$ , 再乘以最后一次出现 $A$ 的概率 $p$ , 即得.

可以算得负二项分布的数学期望为 $r / p$ , 方差为 $r(1-p) / p^2$ . 从直观上看这是合理的, 因为首次出现 $A$ 的平均试验次数是 $1 / p$ , 那么第 $r$ 个 $A$ 出现所需的平均试验次数是 $r / p$ .
如果将第一个 $A$ 出现的试验次数记为 $X_1$ , 第二个 $A$ 出现的试验次数(从第一个 $A$ 出现之后算起) 记为 $X_2, \cdots$ , 第 $r$ 个 $A$ 出现的试验次数(从第 $r - 1$ 个 $A$ 出现之后算起) 记为 $X_{,}$ , 见下图。
$\underbrace{\bar{A} \bar{A} \cdots \bar{A} A}_{X_1} \underbrace{\bar{A} \bar{A} \cdots \bar{A} A}_{X_2} \cdots \underbrace{\bar{A} \bar{A} \cdots \bar{A} A}_{X_r}$

则 $X_i$ 独立同分布, 且 $X_i \sim G e(p)$ . 此时有 $X=X_1+X_2+\cdots+X_{r}\sim N b(r, p)$ 布的随机变量可以表示成 $r$ 个独立同分布的几何分布随机变量之和.

2.5 常用的连续分布

2.5.1 正态分布

一、正态分布的密度函数和分布函数

若随机变量 $X$ 的密度函数为
$p(x)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^2}{2 \sigma^2}},-\inftyp(x)=2π σ1e−2σ2(x−μ)2,−∞<x<∞,$

二、标准正态分布

称 $\mu=0, \sigma=1$ 时的正态分布 $N (0, 1)$ 为标准正态分布.

三、正态变量的标准化

正态分布有一个家族
$\left.\mathscr{P}=\mid N\left(\mu, \sigma^2\right):-\infty<\mu<\infty, \sigma>0\right\} \text {, }$
以下定理说明:对一般正态分布都可以通过一个线性变换 (标准化)化成标准正态分布. 因此与正态变量有关的一切事件的概率都可通过查标准正态分布函数表获得. 由此可见标准正态分布 $N (0, 1)$ 对一般正态分布 $N\left(\mu, \sigma^2\right)$ 的计算起着关键的作用.

定理 2.5.1 若随机变量 $\sim N\left(\mu, \sigma^2\right)$ , 则 $U=(X-\mu) / \sigma \sim N(0,1)$ .

四、正态分布的数学期望与方差

正态分布 $N\left(\mu, \sigma^2\right)$ 中的 $\mu$ 为数学期望，而另一个参数 $\sigma^2$ 就是 $X$ 的方差.
在求正态分布的数学期望和方差中, 用到了一种变换: 令 $U=(X-\mu) / \sigma$ , 由 $\operatorname{Var}(U)=1$ , 然后再去求出 $X$ 的数学期望和方差. 这个变换具有普遍意义, 也就是对任意随机变量 $X$ , 如果 $X$ 的数学期望为 $\mu$ , 方差为 $\sigma^2$ , 则称
$X^*=\frac{X-\mu}{\sigma}$
为 $X$ 的标准化随机变量, 且可得
$E\left(X^*\right)=0, \quad \operatorname{Var}\left(X^*\right)=1 .$
五、正态分布的 $\sigma$ 原则

尽管正态变是的取值范围是 $(-\infty, \infty)$ , 但它的 $\%$ 的值落在 $(\mu-3 \sigma, \mu+3 \sigma)$ 内.

2.5.2 均匀分布

一、均匀分布的密度函数和分布函数

若随机变量 $X$ 的密度函数为
$\begin{cases}\frac{1}{b-a}, & ap(x)={b−a1,0,a<x<b, 其他. $

设随机变量 $\sim U(a, b)$ , 则
$E(X)=\int_a^b \frac{x}{b-a} \mathrm{~d} x=\frac{b^2-a^2}{2(b-a)}=\frac{a+b}{2},$
这正是区间 $(a, b)$ 的中点.
$X$ 的方差为
$\operatorname{Var}(X)=E\left(X^2\right)-[E(X)]^2=\frac{a^2+a b+b^2}{3}-\frac{(a+b)^2}{4}=\frac{(b-a)^2}{12} .$

2.5.3 指数分布

一、指数分布的密度函数和分布函数
若随机变量 $X$ 的密度函数为
$p(x)=\left\{\begin{array}{cc} \lambda \mathrm{e}^{-\lambda x}, & x \geqslant 0, \\ 0, & x<0, \end{array}\right.$
则称 $X$ 服从指数分布, 记作 $\sim \operatorname{Exp}(\lambda)$ , 其中参数 $\lambda>0$ . 指数分布的分布函数为

$X$ 服从指数分布, 记作 $\sim E x$ 参数 $\lambda>0$ . 指数分布的分布函数为
$F(x)=\left\{\begin{array}{cl} 1-\mathrm{e}^{-\lambda x}, & x \geqslant 0, \\ 0, & x<0 . \end{array}\right.$
二、指数分布的数学期望和方差

设随机变量 $\sim \operatorname{Exp}(\lambda)$ , 则
$\begin{aligned} E(X) &=\int_0^{\infty} x \lambda \mathrm{e}^{-\lambda x} \mathrm{~d} x=\int_0^{\infty} x \mathrm{~d}\left(-\mathrm{e}^{-\lambda x}\right) \\ &=-\left.x \mathrm{e}^{-\lambda x}\right|_0 ^{\infty}+\int_0^{\infty} \mathrm{e}^{-\lambda x} \mathrm{~d} x=-\left.\frac{1}{\lambda} \mathrm{e}^{-\lambda x}\right|_0 ^{\infty}=\frac{1}{\lambda} . \end{aligned}$
$X$ 的方差为
$\operatorname{Var}(X)=E\left(X^2\right)-[E(X)]^2=\frac{2}{\lambda^2}-\frac{1}{\lambda^2}=\frac{1}{\lambda^2} .$

三、指数分布的无记忆性

定理 2.5.2(指数分布的无记忆性) 如果随机变量 $\sim \operatorname{Exp}(\lambda)$ , 则对任意 $s > 0, t > 0$ , 有
$\mid X>s)=P(X>t) .$

上式的意义为: 记 $X$ 是某种产品的使用寿命 ( $\mathrm{h})$ , 若 $X$ 服从指数分布, 那么已知此产品使用了s $(\mathrm{h})$ 没发生故障, 则再能使用 $t(\mathrm{~h})$ 而不发生故障的概率与已使用的 $s(\mathrm{~h})$ 无关, 只相当于重新开始使用 $t(\mathrm{~h})$ 的概率, 即对已使用过的 $s(\mathrm{~h})$ 没有记忆.
指数分布的无记忆性与几何分布的无记忆性是类似的.

2.5.4 伽玛分布

一、伽玛函数
称以下函数
$\Gamma(\alpha)=\int_0^{\infty} x^{\alpha-1} \mathrm{e}^{-x} \mathrm{~d} x$
为伽玛函数, 其中参数 $\alpha>0$ . 伽玛函数具有如下性质:
(1) $\Gamma(1)=1, \Gamma\left(\frac{1}{2}\right)=\sqrt{\pi}$ .
(2) $\Gamma(\alpha+1)=\alpha \Gamma(\alpha)$ (可用分部积分法证得). 当 $\alpha$ 为自然数 $n$ 时, 有 $\Gamma(n+1)=n \Gamma(n)=n !$ .
二、伽玛分布
若随机变量 $X$ 的密度函数为
$\begin{cases}\frac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha-1} \mathrm{e}^{-\lambda x}, & x \geqslant 0, \\ 0, & x<0,\end{cases}$
则称 $X$ 服从伽玛分布, 记作 $\sim G a(\alpha, \lambda)$ , 其中 $\alpha>0$ 为形状参数, $\lambda>0$ 为尺度参数.

三、伽玛分布 $a(\alpha, \lambda)$ 的数学期望和方差
利用伽玛函数的性质, 不难算得伽玛分布 $\mathrm{Ga}(\alpha, \lambda)$ 的数学期望为
$E(X)=\frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} x^\alpha \mathrm{e}^{-\lambda x} \mathrm{~d} x=\frac{\Gamma(\alpha+1)}{\Gamma(\alpha)} \frac{1}{\lambda}=\frac{\alpha}{\lambda},$
$X$ 的方差为
$\operatorname{Var}(X)=E\left(X^2\right)-[E(X)]^2=\frac{\alpha(\alpha+1)}{\lambda^2}-\left(\frac{\alpha}{\lambda}\right)^2=\frac{\alpha}{\lambda^2} .$
四、伽玛分布的两个特例
伽玛分布有两个常用的特例:

$\alpha=1$ 时的伽玛分布就是指数分布, 即
$\operatorname{Ga}(1, \lambda)=\operatorname{Exp}(\lambda) .$
称 $\alpha=n / 2, \lambda=1 / 2$ 时的伽玛分布是自由度为 $n$ 的 $\chi^2$ (卡方) 分布, 记为 $\chi^2(n)$ , 即
$a\left(\frac{n}{2}, \frac{1}{2}\right)=\chi^2(n),$
其密度函数为
$p(x)=\left\{\begin{array}{cc} \frac{1}{2^{\frac{n}{2}} \Gamma\left(\frac{n}{2}\right)} \mathrm{e}^{-\frac{4}{2} x^{\frac{\pi}{2}-1}}, & x>0, \\ 0, & x \leqslant 0 . \end{array}\right.$

因为 $\chi^2$ 分布是特殊的份玛分布, 故由伽玛分布的期望和方差, 很容易得到 $\chi^2$ 分布的期望和方差为
$\quad \operatorname{Var}(X)=2 n .$

2.5.5 贝塔分布

一、贝塔函数
称以下函数
$\mathrm{B}(a, b)=\int_0^1 x^{a-1}(1-x)^{b-1} \mathrm{~d} x$
为贝塔函数, 其中参数 $a > 0, b > 0$ . 贝塔函数具有如下性质：
(1) $\mathrm{B}(a, b)=\mathrm{B}(b, a)$ .

(2) 贝塔函数与伽玛函数间有关系
$\mathrm{B}(a, b)=\frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)} .$

二、贝塔分布
若随机变量 $X$ 的密度函数为 $\begin{cases}\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} x^{a-1}(1-x)^{b-1}, & 0p(x)={Γ(a)Γ(b)Γ(a+b)xa−1(1−x)b−1,0,0<x<1, 其他, $

三、贝塔分布 $B e (a, b)$ 的数学期望和方差
利用贝塔函数的性质, 不难算得贝塔分布 $\operatorname{Be}(a, b)$ 的数学期望为
$\begin{aligned} E(X) &=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \int_0^1 x^a(1-x)^{b-1} \mathrm{~d} x \\ &=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \cdot \frac{\Gamma(a+1) \Gamma(b)}{\Gamma(a+b+1)}=\frac{a}{a+b} . \end{aligned}$
$X$ 的方差为 $\operatorname{Var}(X)=\frac{a(a+1)}{(a+b)(a+b+1)}-\left(\frac{a}{a+b}\right)^2=\frac{a b}{(a+b)^2(a+b+1)} .$

2.6 随机变量函数的分布

设 $y = g (x)$ 是定义在直线上的一个函数, $X$ 是一个随机变量, 那么 $Y =$ $g (X)$ 作为 $X$ 的函数, 同样也是一个随机变量. 在实际问题中, 我们经常感兴趣的问题是: 已知随机变量 $X$ 的分布, 如何求出另一个随机变量 $Y = g (X)$ 的分布.

2.6.1 离散随机变量函数的分布

离散随机变量函数的分布是比较容易求得的，在此不做赘述。

2.6.2 连续随机变量函数的分布

对连续随机变量 $X$ ,我们分以下几种情况讨论 $Y = g (X)$ 的分布.
一、当 $g (x)$ 为严格单调时

定理 2.6.1 设 $X$ 是连续随机变量，其密度函数为 $p_X(x) . Y=g(X)$ 是另一个随机变量. 若 $y = g (x)$ 严格单调, 其反函数 $h (y)$ 有连续导函数, 则 $Y = g (X)$ 的密度函数为
$p_\gamma(y)=\left\{\begin{array}{lc} p_x[h(y)]\left|h^{\prime}(y)\right|, & apγ(y)={px[h(y)]∣h′(y)∣,0,a<y<b, 其他. $

定理 2.6.2 设随机变量 $X$ 服从正态分布 $N(\mu, \sigma)$ , 则当 $\neq 0$ 时, 有 $Y =$ $\sim N\left(a \mu+b, a^2 \sigma^2\right)$ .

这个定理表明:正态变量的线性变换仍为正态变量,其数学期望和方差可直接从线性变换求得.

定理 2.6.3(对数正态分布) 设随机变量 $\sim N\left(\mu, \sigma^2\right)$ , 则 $Y=\mathrm{e}^x$ 的概率密度函数为
$p_\gamma(y)= \begin{cases}\frac{1}{\sqrt{2 \pi} y \sigma} \exp \left\{-\frac{(\ln y-\mu)^2}{2 \sigma^2}\right\}, & y>0, \\ 0, & y \leqslant 0 .\end{cases}$

这个分布被称为对数正态分布, 记为 $N\left(\mu, \sigma^2\right)$ , 其中 $\mu$ 称为对数均值, $\sigma^2$ 称为对数方差.

定理 2.6.4 设随机变量 $X$ 服从伽玛分布 $a(\alpha, \lambda)$ , 则当 $k > 0$ 时, 有 $\sim G a(\alpha, \lambda / k)$ .

定理 2.6.5 若随机变量 $X$ 的分布函数 $F_x(x)$ 为严格单调增的连续函数, 其反函数 $F_x^{-1}(y)$ 存在, 则 $Y=F_x(X)$ 服从 $(0, 1)$ 上的均匀分布 $U (0, 1)$ .

这个定理表明: 均匀分布在连续分布类中占有特殊地位. 任一个连续随机变量 $X$ 都可通过其分布函数 $F (x)$ 与均匀分布随机变量 $U$ 发生关系. 譬如 $X$ 服从指数分布 $\operatorname{Exp}(\lambda)$ , 其分布函数为 $F(x)=1-\mathrm{e}^{-\lambda x}$ , 当 $x$ 换为 $X$ 后, 有
$U=1-\mathrm{e}^{-\lambda x} \text { 或 } X=\frac{1}{\lambda} \ln \frac{1}{1-U} \text {. }$
后一式表明: 由均匀分布 $U (0, 1)$ 的随机数 (由观察值) $u_i$ 可得指数分布 $\operatorname{Exp}(\lambda)$ 的随机数 $x_i=\frac{1}{\lambda} \ln \frac{1}{1-u_i}, i=1,2, \cdots, n, \cdots$ . 而均匀分布随机数在任一个统计软件都可产生, 从而指数分布 (继而其他分布) 随机数也可获得. 而各种分布随机数的获得是进行随机模拟法 (又称蒙特卡罗法)的基础.

二、当 $g (x)$ 为其他形式时
当使用定理 2.6.1 寻求 $Y = g (X)$ 的分布有困难时, 可直接由 $Y$ 的分布函数 $F_\gamma(y)=P(g(X) \leqslant y)$ 出发, 按函数 $g (x)$ 的特点作个案处理。

2.7 分布的其他特征数

2.7.1 $k$ 阶矩

定义 2.7.1
设 $X$ 为随机变量, $k$ 为正整数. 如果以下的数学期望都存在, 则称
$\mu_k=E\left(X^k\right)$
为 $X$ 的 $k$ 阶原点矩. 称
$\nu_{k}=E(X-E(X))^k$
为 $X$ 的 $k$ 阶中心矩.

显然,一阶原点矩就是数学期望, 二阶中心矩就是方差. 由于 $|X|^{k-1} \leqslant$ $X|^k+1$ , 故 $k$ 阶矩存在时, $k - 1$ 阶矩也存在, 从而低于 $k$ 的各阶矩都存在. 中心矩和原点矩之间有一个简单的关系,
$\nu_k=E(X-E(X))^k=E\left(X-\mu_1\right)^k=\sum_{i=0}^i\left(\begin{array}{l} k \\ i \end{array}\right) \mu_i\left(-\mu_1\right)^{k-i} \text {, }$
故前四阶中心矩可分别用原点矩表示如下:
$\begin{aligned} &\nu_1=0, \\ &\nu_2=\mu_2-\mu_1^2, \\ &\nu_3=\mu_3-3 \mu_2 \mu_1+2 \mu_1^3, \\ &\nu_4=\mu_4-4 \mu_3 \mu_1+6 \mu_2 \mu_1^2-3 \mu_1^4 . \end{aligned}$

2.7.2 变异系数

方差 (或标准差) 反映了随机变量取值的波动程度,但在比较两个随机变量的波动大小时, 如果仅看方差 (或标准差) 的大小有时会产生不合理的现象. 这有两个原因: (1) 随机变量的取值有量纲, 不同量纲的随机变量用其方差(或标准差)去比较它们的波动大小不太合理. (2) 在取值的量纲相同的情况下, 取值的大小有一个相对性问题, 取值较大的随机变量的方差 (或标准差) 也允许大一些.
所以要比较两个随机变量的波动大小时, 在有些场合使用以下定义的变异系数来进行比较, 更具可比性.

定义 2.7.2
设随机变量 $X$ 的二阶矩存在, 则称比值
$C_i(X)=\frac{\sqrt{\operatorname{Var}(X)}}{E(X)}=\frac{\sigma(X)}{E(X)}$
为 $X$ 的变异系数.
因为变异系数是以其数学期望为单位去度量随机变量取值波动程度的特征数, 标准差的量纲与数学期望的量纲是一致的, 所以变异系数是一个无量纲的量,从而消除量纲对波动的影响.

2.7.3 分位数

定义 2.7.3
设连续随机变量 $X$ 的分布函数为 $F (x)$ , 密度函数为 $p (x)$ . 对任意 $\in(0,1)$ ,称满足条件
$F\left(x_p\right)=\int_{-\infty}^{x_p} p(x) \mathrm{d} x=p$
的 $x$ , 为此分布的 $p$ 分位数，又称下侧 $p$ 分位数.

同理我们称满足条件
$1-F\left(x_p^{\prime}\right)=\int_{x_p^{\prime}}^{\infty} p(x) \mathrm{d} x=p$
的 $x_1^{\prime}$ 为此分布的上侧 $p$ 分位数.

分位数与上侧分位数是可以相互转换的, 其转换公式如下.
$x_p^{\prime}=x_{1-p}, \quad x_p=x_{1-p}^{\prime} \text {. }$

2.7.4 中位数

定义 2.7.4
设连续随机变量 $X$ 的分布函数为 $F (x)$ , 密度函数为 $p (x)$ . 称 $p = 0.5$ 时的 $p$ 分位数 $x_{0.5}$ 为此分布的中位数, 即 $x_{0.5}$ 满足
$F\left(x_{0.5}\right)=\int_{-\infty}^{x_{0.5}} p(x) \mathrm{d} x=0.5 .$

2.7.5 偏度系数

定义 2.7.5 设随机变量 $X$ 的前三阶矩存在, 则如下比值
$\beta_S=\frac{\nu_3}{\nu_2^{3 / 2}}=\frac{E(X-E X)^3}{[\operatorname{Var}(X)]^{3 / 2}}$
称为 $X$ (或分布) 的偏度系数, 简称偏度. 当 $\beta_s>0$ 时, 称该分布为正偏, 又称右偏;当 $\beta_s<0$ 时，称该分布为负偏，又称左偏.

2.7.6 峰度系数

定义 2.7.6
设随机变量 $X$ 的前四阶矩存在, 则如下比值减去 3
$\beta_k=\frac{\nu_4}{\nu_2^2}-3=\frac{E(X-E X)^4}{[\operatorname{Var}(X)]^2}-3$
称为 $X$ (或分布) 的峰度系数, 简称峰度.

你可能感兴趣的:(概率论)

规控算法工程师的技术图谱和学习路径执于代码开发者职业加速服务算法学习
规控算法工程师技术图谱与学习路径规控算法工程师（规划与控制算法工程师）是自动驾驶领域的核心岗位之一，涉及路径规划、行为决策、运动控制等多个技术模块。以下为技术图谱与学习路径的整合，结合行业需求和技术发展趋势。一、技术图谱核心模块数学基础线性代数：矩阵运算、向量空间、特征值分解（用于控制系统建模与优化）。微积分：梯度下降、泰勒展开、动态系统建模（支持控制算法推导）。概率论与统计学：贝叶斯理论、马尔可
图像算法工程师的技术图谱和学习路径执于代码开发者职业加速服务算法学习
01.图像算法图像算法工程师的技术图谱和学习路径涵盖了多个技术领域，从基础知识到高级算法，涉及计算机视觉、深度学习、图像处理、数学和编程等多个方面。以下是图像算法工程师的技术图谱和学习路径的详细总结。1.基础数学与编程数学基础：线性代数：矩阵运算、特征值、特征向量、奇异值分解（SVD）等概率论与统计：概率分布、贝叶斯定理、最大似然估计（MLE）、假设检验等微积分：导数、梯度、最优化方法（梯度下降、
推荐算法工程师的技术图谱和学习路径执于代码开发者职业加速服务推荐算法学习算法
推荐算法工程师的技术图谱和学习路径可以从多个维度进行概述，可以总结如下：一、技术图谱推荐算法工程师需要掌握的技术栈主要分为以下几个方面：数学基础：微积分、线性代数、概率论与统计学是推荐算法的基础，用于理解模型的数学原理和优化算法。高等数学、最优化理论、几何和图论等知识对于复杂模型的设计和优化至关重要。编程与数据结构：熟练掌握Python、Java等编程语言，具备良好的编程习惯和代码优化能力。掌握数
聚类分析tensorflow实例_新手必看的机器学习算法集锦（聚类篇）道酝欣赏
继上一篇《机器学习算法之分类》中大致梳理了一遍在机器学习中常用的分类算法，类似的，这一姊妹篇中将会梳理一遍机器学习中的聚类算法，最后也会拓展一些其他无监督学习的方法供了解学习。1.机器学习机器学习是近20多年兴起的一门多领域交叉学科，它涉及到概率论、统计学、计算机科学以及软件工程等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类能从数据中自动分析获得规律
概率论——5 事件的独立性黑曼巴、。；概率论
文章目录事件独立性描述性定义数学定义相关定理多事件独立性事件独立性描述性定义设A,BA,BA,B为两个事件，如果其中任何一个事件发生的概率不受另一个事件发生与否的影响，则称事件AAA与BBB相互独立。数学定义数学定义其实可以由条件概率推导得到，当事件AAA与BBB独立时，BBB在AAA的条件下发生的概率应该等于P(B)P(B)P(B)，反之亦然，则可以得到下面的等式：P(B∣A)=P(AB)P(A
【概率论】多维随机变量及其分布 return bool(1) 概率论概率论学习
文章目录二维随机变量一、二维随机变量的定义二、分布函数的定义三、分布函数的性质1.单调不减2.规范性3.右连续4.非负性四、二维离散型随机变量1.定义2.性质3.联合分布律五、二维连续性随机变量1.定义2.性质3.求法边缘分布一、定义1.边缘分布函数2.边缘分布律3.边缘概率密度条件分布一、条件分布律的定义二、条件概率密度的定义三、两种重要的二维连续性随机变量1.均匀分布2.二维正态分布四、随机变
大模型学习路线与资源推荐数字化转型2025 AI投资人工智能
以下是基于多篇参考资料整理的大模型学习路线，涵盖从基础到进阶的完整学习路径，帮助您系统掌握大模型核心技术并应用于实际场景：一、基础阶段：构建核心知识体系编程与数学基础编程语言：优先学习Python，掌握其语法、数据结构及常用库（如NumPy、Pandas、PyTorch）37。数学基础：线性代数、概率论与统计学、微积分是理解模型原理的基石，需重点掌握矩阵运算、概率分布等概念39。深度学习入门神经网
Java程序员面临抉择：激烈竞争下，转行大模型或是新出路，非常详细收藏我这一篇就够了！大模型教程大模型学习学习大模型语言模型人工智能程序员转行
Java程序员转行大模型领域，可以依据以下详细路线进行学习和职业转换：第1阶段：基础知识巩固数学基础：线性代数：矩阵运算、向量空间等。概率论与统计：概率分布、统计推断等。微积分：导数、积分、多变量函数等。Python编程：Python基础：数据类型、控制结构、函数等。Python进阶：面向对象编程、装饰器、生成器等。数据处理：NumPy、Pandas、Matplotlib。第2阶段：机器学习与深度
一文读懂！深度学习 + PyTorch 的超实用学习路线 a小胡哦深度学习 python pytorch
深度学习作为人工智能领域的核心技术，正深刻改变着诸多行业。PyTorch则是深度学习实践中备受青睐的框架，它简单易用且功能强大。下面就为大家详细规划深度学习结合PyTorch的学习路线。一、基础知识储备数学基础数学是很重要的！！！线性代数、概率论与数理统计、微积分是深度学习的数学基石。熟悉矩阵运算、概率分布、梯度计算等概念，能帮助理解深度学习模型的原理。例如，在神经网络中，矩阵乘法用于神经元之间的
书籍-《概率论I：随机变量与分布》概率人工智能
书籍：ProbabilityTheoryI:RandomVariablesandDistributions作者：AndreaPascucci出版：Springer编辑：陈萍萍的公主@一点人工一点智能书籍下载-《概率论I：随机变量与分布》01书籍介绍本书提供了概率论简洁而严谨的介绍。在处理这一主题的各种方法中，选择了基于测度理论的最现代方法：尽管这种方法需要更高的数学抽象和精密度，但对于更高级话题如
用大模型学大模型03-数学基础概率论 wyg_031113 概率论人工智能
https://metaso.cn/s/Jp0OU9w提示词:我正在学习深度学习相关的数学知识，学到了概率论与统计学部分，给我一个入门级的完整教程和实例。好的，我现在需要回答用户关于深度学习所需的概率论与统计学入门教程和实例的问题。用户希望得到一个完整的教程和实例，所以我要从我搜索到的资料中整理出相关的知识点和学习路径，并结合实例说明。首先，查看证据中的相关内容。提到花书学习笔记，涵盖了概率论、信
【一起看花书1.3】——第5章机器学习基础应有光基础知识机器学习人工智能深度学习
先验是“知识”，是合理的假设本文内容对应于原书的5.7-5.11共5小节内容，其中知识性、结论性的内容偏多，也加入了点个人见解。目录：5.7监督学习5.8无监督学习5.9随机梯度下降5.10构建机器学习算法5.11深度学习发展的动力5.7监督学习监督学习，本质上是复杂函数的拟合，即给定特征xxx,我们需要得到标签yyy，这不就是求一个函数的拟合嘛？线性回归是比较简单的，从高代、概率论就可以理解，甚
书籍-《机器学习数学基础》机器学习深度学习数学
书籍：MathematicsforMachineLearning作者：MarcPeterDeisenroth，A.AldoFaisal，ChengSoonOng出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《机器学习数学基础》01书籍介绍理解机器学习所需的基本数学工具包括线性代数、解析几何、矩阵分解、向量微积分、最优化、概率论和统计学。这
【深入探索-deepseek】高等数学与AI的因果关系我的青春不太冷人工智能机器学习数学
目录数学在AI不同领域的应用区别一、计算机视觉领域1.线性代数2.微积分3.概率论与统计二、自然语言处理领域三、语音识别领域四、数学在AI不同领域应用的逻辑图五、参考资料数学在AI不同领域的应用区别一、计算机视觉领域1.线性代数图像变换：想象我们有一张二维图片，图片里有个点，它的位置用坐标((x,y))表示。现在我们想把这个点绕着图片的原点（就像把纸钉在墙上，以钉子的位置为中心）逆时针旋转一定角度
AI基础 -- AI学习路径图 sz66cm 人工智能学习
人工智能从数学到大语言模型构建教程第一部分：AI基础与数学准备1.绪论：人工智能的过去、现在与未来人工智能的定义与发展简史从符号主义到统计学习、再到深度学习与大模型的变迁本书内容概览与学习路径指引2.线性代数与矩阵运算向量与矩阵的基本概念矩阵分解（特征值分解、奇异值分解）张量运算简介（为后续深度学习做准备）在机器学习和深度学习中的应用示例3.概率论与统计基础随机变量、分布与期望方差贝叶斯理论与最大
AI学习专题（一）LLM技术路线王钧石的技术博客大模型人工智能学习 ai
阶段1：AI及大模型基础（1-2个月）数学基础线性代数（矩阵、特征值分解、SVD）概率论与统计（贝叶斯定理、极大似然估计）最优化方法（梯度下降、拉格朗日乘子法）编程&框架Python（NumPy、Pandas、Matplotlib）PyTorch&TensorFlow基础HuggingFaceTransformers入门深度学习基础机器学习基础（监督/无监督学习、正则化、过拟合）反向传播、优化器（
自动驾驶领域成长方案树上求索自动驾驶人工智能机器学习
一、学习目标成为自动驾驶领域专家，全面掌握自动驾驶技术体系，能独立进行自动驾驶系统设计、开发与优化，解决实际工程问题。二、成长阶段（一）基础理论奠基期（1-2年）专业知识学习：学习数学（高等数学、线性代数、概率论与数理统计、数值分析等），为理解算法和模型提供数学基础；深入研究自动驾驶涉及的专业课程，如控制理论、传感器原理（激光雷达、摄像头、毫米波雷达等）、机器学习（监督学习、无监督学习、深度学习）
2025最新最全AI大模型系统学习路线大模型老炮人工智能学习大模型知识图谱大模型入门 AI大模型大模型学习
随着技术的进步，大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及视频。所以掌握大模型的知识和技能变得越来越重要。下面是学习大模型的一些建议，供大家参考。必备基础知识**数学基础：**深入理解线性代数、概率论和统计学、微积分等基础数学知识。**编程基础：**熟练掌握至少一种编程语言，推荐Python，因为
2025年最新最全的大模型学习路线规划，对于零基础入门到精通的学习者来说，可以遵循以下阶段进行程序员辣条学习大模型学习 AI产品经理人工智能 LLama 大模型大模型教程
2025年最新最全的大模型学习路线规划，对于零基础入门到精通的学习者来说，可以遵循以下阶段进行：一、基础准备阶段数学基础：学习线性代数、微积分、概率论与数理统计等基础知识。这些数学基础对于理解大模型的原理和算法至关重要。编程语言：熟练掌握Python编程，这是大模型开发的首选语言。同时，了解常用的深度学习框架，如TensorFlow和PyTorch。深度学习基础：学习深度学习的基本原理和常用算法，
二项分布：成功与失败概率的交织呈现进一步有进一步的欢喜二项分布几何分布伯努利分布概率论深度学习
引言在概率论与数理统计的庞大体系中，二项分布占据着举足轻重的地位。它作为一种离散型概率分布，广泛应用于众多领域，从自然科学到社会科学，从工业生产到日常生活，都能看到它的身影。深入探究二项分布，不仅有助于我们理解随机现象背后的数学原理，还能为解决实际问题提供强大的工具。而回顾其发展历程，能让我们更全面地把握这一概念的来龙去脉。同时，了解二项分布与其他相关概念，如几何分布、二项式定理的联系，将进一步加
超实用的Python机器学习教程 - 基于scikit - learn库 AI_DL_CODE 人工智能 python 机器学习人工智能
一、机器学习简介机器学习的定义与概念机器学习是一门多领域交叉学科，它涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。简单来说，机器学习是让计算机从数据中学习规律并进行预测或决策的技术。它旨在构建能够自动从数据中学习模式并进行改进的算法，而无需被明确编程来执行特定任务。例如，我们可以让机器学习算法通过分析大量的历史天气数据来预测未来的天气情况，或者通过分析用户的购物历史来推荐可能感兴趣
神经网络|(七)概率论基础知识-贝叶斯公式西猫雷婶概率论人工智能概率论
【1】引言前序我们已经了解了一些基础知识。古典概型：有限个元素参与抽样，每个元素被抽样的概率相等。条件概率：在某条件已经达成的前提下，新事件发生的概率。实际计算的时候，应注意区分，如果是计算综合概率，比如A已经发生时，B发生的概率，其实计算的目标是P(AB)。条件概率公式的通用表达式为P(B|A)=P(AB)/P(A)，乘法表达式为P(AB)=P(B|A)P(A)全概率公式：全概率公式综合了所有条
机器学习入门——机器学习基本概念四月是你的机器学习
@机器学习什么是机器学习机器学习(MachineLearning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎简单来说机器学习就是机
统计学中的样本&概率论中的样本 phoenix@Capricornus 模式识别中的数学问题概率论
不知道当初谁想的把概率论和数理统计合并，作为一门课。这本身是可以合并，完整的一条线，看这里。但是，作为任课老师应该从整体上交代清楚，毕竟是两个学科，不同的学科合并必然会有各种不协调的问题。举个最基本的名词冲突的例子。统计学中的样本在统计学中，样本是从总体（Population）中选取的一部分个体或观测值。它用来代表整个总体，并用于估计总体的特征或参数。例如，如果我们想了解一个城市居民的平均收入，我
P3978 [TJOI2015] 概率论洛谷之蒟蒻概率论
题目描述为了提高智商，ZJY开始学习概率论。有一天，她想到了这样一个问题：对于一棵随机生成的n个结点的有根二叉树（所有互相不同构的形态等概率出现），它的叶子节点数的期望是多少呢？判断两棵树是否同构的伪代码如下：算法1Check(T1,T2)Require:两棵树的节点ifT1=nullorT2=nullthenreturnT1=nullandT2=nullelsereturnCheck(T1→le
svm python 模型绘图_1SVM处理数据并绘图张炜大师傅 svm python 模型绘图
爬虫Python基础、数据分析扩展包Numpy、pandas、matplotlib，Python读取MySQL数据，Python爬虫及Scrapy框架，无监督机器学习算法聚类分析等，以及案例：互联网金融行业客户价值分析等。机器学习机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有
【AI中数学-概率论-综合实例-包括python实现】预测的守望者：动态贝叶斯网络在风险预警中的应用云博士的AI课堂 AI中的数学人工智能概率论 python 贝叶斯网络机器学习 AI数学
第四章：概率论-综合实例第2节预测的守望者：动态贝叶斯网络在风险预警中的应用在许多现实世界的应用中，预测和风险评估通常不仅依赖于静态的输入数据，而是需要考虑时间维度和动态变化。动态贝叶斯网络（DBN,DynamicBayesianNetwork）作为一种扩展了传统贝叶斯网络的工具，可以有效地处理时间序列数据，并进行时序预测。与静态贝叶斯网络不同，DBN能够通过建模系统状态随时间的变化，揭示出更为复
数学：机器学习的理论基石每天五分钟玩转人工智能机器学习人工智能
一、数学：机器学习的理论基石机器学习是一种通过数据学习模式和规律的科学。其核心目标是从数据中提取有用的信息，以便对未知数据进行预测和分类。为了实现这一目标，机器学习需要一种数学框架来描述和解决问题。数学在机器学习中起着至关重要的作用，它提供了一种数学模型来描述数据和模式，以及一种数学方法来优化模型。数学在机器学习中的应用非常广泛，涵盖了线性代数、概率论、统计学、微积分、优化等多个领域。这些数学方法
Python字典详解 2401_89224765 python 开发语言
print(dict4)需要注意的是：fromkeys方法只用来创建新字典，不负责保存。当通过一个字典来调用fromkeys方法时，如果需要后续使用一定记得给他复制给其他的变量。②访问字典：第一阶段：基操勿6！如果要想获取字典中某个键的值，可以通过访问键的方式来显示对应的值。上代码：dict={‘线代’:“99”,“数据分析”:“99”,“概率论”:“98”}#创建字典print(‘小红同学的线代
【概率论与数理统计】第三章多维随机变量及其分布(3) Arthur古德曼概率论与数理统计概率论多维随机变量二维随机变量独立性概率分布夏明亮
2随机变量的独立性2.1两个随机变量的独立性在多维随机变量中各分量的取值有时会互相影响，但有时也会毫无影响。例如，一个人的身高XXX和体重YYY之间就会互相影响，但与收入ZZZ一般就没什么影响。这里，我们根据两个事件的独立性引出两个随机变量的独立性：之前我们这样描述：事件{X≤x}\{X\lex\}{X≤x}与事件{Y≤y}\{Y\ley\}{Y≤y}的积事件{X≤x,Y≤y}\{X\lex,\Y
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj