机器学习中常用的一些数学公式

数据标准化:(StandardScaler)(这里是对列操作,相当与某个特征)

对每维特征单独处理:

xi=xiuσ x i ′ = x i − u σ

u=i=1Nxi,σ=i=1N(xiu)2 u = ∑ i = 1 N x i , σ = ∑ i = 1 N ( x i − u ) 2

MinMaxScaler:(这里也是对列操作)

对每维特征单独处理:

xi=ximinmaxmin x i ′ = x i − m i n m a x − m i n

min=min{x1,...,xn} m i n = m i n { x 1 , . . . , x n }

max=max{x1,...xn} m a x = m a x { x 1 , . . . x n }

数据正规划/归一化:(这个是对行操作,相当与一个样本)

对每个样本单独处理:

Xi=Xi||Xi||2=XiDj=1x2ij X i ′ = X i | | X i | | 2 = X i ∑ j = 1 D x i j 2

这里的 ||xi||2 | | x i | | 2 数字2:二范数,也就是对应后面的开根号的式子,其中的D是指的样本的维度(特征的个数)

夹角余弦值:

比较两个样本或者两种数据的分布的相似度:

d(H1,H2)=I(H1(I)H1¯)(H2(I)H2¯)I(H1(I)H1¯)2I(H2(I)H2¯)2 d ( H 1 , H 2 ) = ∑ I ( H 1 ( I ) − H 1 ¯ ) ( H 2 ( I ) − H 2 ¯ ) ∑ I ( H 1 ( I ) − H 1 ¯ ) 2 ∑ I ( H 2 ( I ) − H 2 ¯ ) 2

分类问题的数学表达:

ŷ =f(X)=arg max p(y=c|X,) y ^ = f ( X ) = a r g   m a x   p ( y = c | X , D )

logistic简单类比推导:

p(y|X)=Ber(y|u(x)) p ( y | X ) = B e r ( y | u ( x ) )

u(x)=σ(WTX) u ( x ) = σ ( W T X )

σ(a)=11+ea=eaea+1 σ ( a ) = 1 1 + e − a = e a e a + 1

你可能感兴趣的:(ML,Python,math)