假设检验之双样本Z检验公式在转化率指标和数值型指标上的应用

一、转化率指标

1.1 理论公式

假设检验之双样本Z检验公式在转化率指标和数值型指标上的应用_第1张图片

1.2 EXCEL公式

对照组样本量和转化:N1,P1

实验组样本量和转化:N2,P2

z_score = (P1 - P2) / SQRT( P1*(1-P1)/N1 + P2*(1-P2)/N2 )

p_value = NORMDIST(z_score,0,1,TRUE)

95%置信 = IF(OR(p_value<0.05,p_value>0.95),"YES","NO")

二、数值型指标

2.1 理论公式

假设检验之双样本Z检验公式在转化率指标和数值型指标上的应用_第2张图片

2.2 EXCEL公式

p=normdist(z,0,1,true)

z=(u1-u2)/sqrt(delta1^2/n1 + delta2^2/n2)

2.3 实例参考

假设检验之双样本Z检验公式在转化率指标和数值型指标上的应用_第3张图片

应用到互联网产品AB实验中,重点在于分别计算实验组和对照组指标的均值和标准差。

数值型指标的标准差可以根据每个样本的数值计算出来。

hive标准差函数:stddev(col_name) 、stddev_pop(col_name)

hive方差函数:var_pop(col_name)

三、探讨

疑问:

0-1分布方差pq

二项分布方差npq

转化率指标Z公式中的方差为啥是用pq呢?

方差公式:

假设检验之双样本Z检验公式在转化率指标和数值型指标上的应用_第4张图片

根据方差公式,可以推导出比率型指标的方差为pq,其中q=1-p

假设p=k/n,n为样本量,k为结果为1的样本个数

则 x拔 = k/n = p; xi=0或1

方差=(sum(xi-x拔)^2) / n

=sum(xi^2 - 2xi*x拔 + x拔^2) / n

=(sum(xi^2) - 2*x拔 * sum(xi) + n*x拔^2)/n

=(k - 2p*k + np^2) / n

=(np - 2np^2 + np^2) / n

=(np - np^2) /n

=p(1-p)

参考:

方差公式 方差公式_百度百科

做AB实验,怎么做数据分析呢?做AB实验,怎么做数据分析呢? - 知乎

04 T检验和Z检验 04 T检验和Z检验 - 知乎

你可能感兴趣的:(数据分析基础,abtest,数据分析)