相关性(correlation)

文章目录

  • 1 皮尔逊相关性
    • 1.1 定义
    • 1.2 性质
  • 2 协方差
  • 3 方差和协方差的关系

1 皮尔逊相关性

1.1 定义

给定两个随机变量, X X X Y Y Y,则 X X X Y Y Y 之间的(皮尔逊)相关性定义为:
Corr ( X , Y ) = Cov ( X , Y ) Var ( X ) ⋅ Var ( Y ) , \text{Corr}(X, Y) = \frac{\text{Cov}(X, Y)}{\sqrt{\text{Var}(X)} \cdot \sqrt{\text{Var}(Y)}}, Corr(X,Y)=Var(X) Var(Y) Cov(X,Y),
其中 X , Y ∈ R X, Y \in \mathcal{R} X,YR

1.2 性质

  • Corr ( X , X ) = 1 \text{Corr}(X, X) = 1 Corr(X,X)=1
  • Corr ( X , Y ) = Corr ( Y , X ) \text{Corr}(X, Y) = \text{Corr}(Y, X) Corr(X,Y)=Corr(Y,X)
  • Corr ( a X + b , Y ) = sign ( a ) Corr ( X , Y ) \text{Corr}(aX+b, Y) = \text{sign}(a)\text{Corr}(X,Y) Corr(aX+b,Y)=sign(a)Corr(X,Y),对于任意的 a , b ∈ R a,b \in \mathcal{R} a,bR
  • − 1 ≤ Corr ( X , Y ) ≤ 1 -1 \leq \text{Corr}(X, Y) \leq 1 1Corr(X,Y)1,当 Corr ( X , Y ) > 0 \text{Corr}(X, Y) > 0 Corr(X,Y)>0 时表示正(线性)关系,当 < 0 < 0 <0 表示负(线性)关系。
  • ∣ Corr ( X , Y ) ∣ = 1 \lvert \text{Corr}(X, Y) \rvert =1 Corr(X,Y)∣=1 当且仅当 Y = a X + b Y= aX+b Y=aX+b 时,其中 a , b ∈ R , a ≠ 0 a,b \in \mathcal{R}, a \neq 0 a,bR,a=0
  • 如果 X , Y X, Y X,Y 互相独立,则 Corr ( X , Y ) = 0 \text{Corr}(X, Y) = 0 Corr(X,Y)=0
  • 如果 Corr ( X , Y ) = 0 \text{Corr}(X, Y) = 0 Corr(X,Y)=0,不能得出 X , Y X, Y X,Y 互相独立。
  • 如果 ( X , Y ) (X, Y) (X,Y) 是双变量正态的且 Corr ( X , Y ) = 0 \text{Corr}(X, Y)=0 Corr(X,Y)=0,则 X , Y X,Y X,Y 是相互独立的。

2 协方差

Cov ( X , Y ) = ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) n = E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] . \text{Cov}(X, Y) = \sum_{i=1}^n \frac{(X_i - \bar{X}) (Y_i - \bar{Y})}{n} = E\left[(X - E[X]) (Y - E[Y]) \right]. Cov(X,Y)=i=1nn(XiXˉ)(YiYˉ)=E[(XE[X])(YE[Y])].

3 方差和协方差的关系

Var ( X ) = E [ ( X − E [ X ] ) 2 ] = Cov ( X , X ) . \text{Var}(X) = E \left[ (X - E[X])^2 \right] = \text{Cov}(X, X). Var(X)=E[(XE[X])2]=Cov(X,X).

你可能感兴趣的:(#,统计学,数学,算法,概率论,机器学习)