本文汇总一下机器学习的常用的数学符号,有点眼花~
x x x: 标量
X {X} X:向量
x x x:标量
x \mathbf{x} x:向量
X \mathbf{X} X:矩阵
X \mathsf{X} X:张量
I \mathbf{I} I:单位矩阵
x i x_i xi, [ x ] i [\mathbf{x}]_i [x]i:向量 x \mathbf{x} x第 i i i个元素
x i j x_{ij} xij, [ X ] i j [\mathbf{X}]_{ij} [X]ij:矩阵 X \mathbf{X} X第 i i i行第 j j j列的元素
X \mathcal{X} X: 集合
Z \mathbb{Z} Z: 整数集合
R \mathbb{R} R: 实数集合
R n \mathbb{R}^n Rn: n n n维实数向量
R a × b \mathbb{R}^{a\times b} Ra×b: 包含 a a a行和 b b b列的实数矩阵
A ∪ B \mathcal{A}\cup\mathcal{B} A∪B: 集合 A \mathcal{A} A和$\mathcal{B}
$的并集
A ∩ B \mathcal{A}\cap\mathcal{B} A∩B:集合 A \mathcal{A} A和 B \mathcal{B} B的交集
A ∖ B \mathcal{A}\setminus\mathcal{B} A∖B:集合 B \mathcal{B} B与集合 A \mathcal{A} A相减
f ( ⋅ ) f(\cdot) f(⋅):函数
log ( ⋅ ) \log(\cdot) log(⋅):自然对数
exp ( ⋅ ) \exp(\cdot) exp(⋅): 指数函数
1 X \mathbf{1}_\mathcal{X} 1X: 指示函数
( ⋅ ) ⊤ \mathbf{(\cdot)}^\top (⋅)⊤: 向量或矩阵的转置
X − 1 \mathbf{X}^{-1} X−1: 矩阵的逆
⊙ \odot ⊙: 按元素相乘
[ ⋅ , ⋅ ] [\cdot, \cdot] [⋅,⋅]:连结
∣ X ∣ \lvert \mathcal{X} \rvert ∣X∣:集合的基数
∥ ⋅ ∥ p \|\cdot\|_p ∥⋅∥p: L p L_p Lp 正则
∥ ⋅ ∥ \|\cdot\| ∥⋅∥: L 2 L_2 L2 正则
⟨ x , y ⟩ \langle \mathbf{x}, \mathbf{y} \rangle ⟨x,y⟩:向量 x \mathbf{x} x和
y \mathbf{y} y的点积
∑ \sum ∑: 连加
∏ \prod ∏: 连乘
= d e f \stackrel{\mathrm{def}}{=} =def:定义
d y d x \frac{dy}{dx} dxdy: y y y关于 x x x的导数
∂ y ∂ x \frac{\partial y}{\partial x} ∂x∂y: y y y关于 x x x的偏导数
∇ x y \nabla_{\mathbf{x}} y ∇xy: y y y关于 x \mathbf{x} x的梯度
∫ a b f ( x ) d x \int_a^b f(x) \;dx ∫abf(x)dx: f f f在 a a a到 b b b区间上关于 x x x的定积分
∫ f ( x ) d x \int f(x) \;dx ∫f(x)dx: f f f关于 x x x的不定积分
P ( ⋅ ) P(\cdot) P(⋅):概率分布
z ∼ P z \sim P z∼P: 随机变量 z z z具有概率分布 P P P
P ( X ∣ Y ) P(X \mid Y) P(X∣Y): X ∣ Y X\mid Y X∣Y的条件概率
p ( x ) p(x) p(x): 概率密度函数
E x [ f ( x ) ] {E}_{x} [f(x)] Ex[f(x)]: 函数 f f f对 x x x的数学期望
X ⊥ Y X \perp Y X⊥Y: 随机变量 X X X和 Y Y Y是独立的
X ⊥ Y ∣ Z X \perp Y \mid Z X⊥Y∣Z: 随机变量 X X X和 Y Y Y在给定随机变量 Z Z Z的条件下是独立的
V a r ( X ) \mathrm{Var}(X) Var(X): 随机变量 X X X的方差
σ X \sigma_X σX: 随机变量 X X X的标准差
C o v ( X , Y ) \mathrm{Cov}(X, Y) Cov(X,Y): 随机变量 X X X和 Y Y Y的协方差
ρ ( X , Y ) \rho(X, Y) ρ(X,Y): 随机变量 X X X和 Y Y Y的相关性
H ( X ) H(X) H(X): 随机变量 X X X的熵
D K L ( P ∥ Q ) D_{\mathrm{KL}}(P\|Q) DKL(P∥Q): P P P和 Q Q Q的KL-散度
O \mathcal{O} O:大O标记