学习:StatQuest-p值及显著性阈值

前言:

以抛硬币来说明,若抛一次硬币,那么将会有50%的概率是正面,50%的概率是反面。
假设我们有一枚硬币,抛第一次将会有50%的概率是正面,50%的概率是反面;抛第二次也是一样的,两次相互独立互不干扰:


image.png

p值概念:

我们想求抛两次硬币,得到一正一反的概率,显然是0.5;而得到两次正面或两次反面的概率分别是0.25,如果我们感兴趣的是两次正面或两次反面的概率,那么p_value为0.25



夸张点,假设说抛了5次,来统计下5次都是正面和5次都是反面的概率和:0.0625
这个值小于0.05,如果我们感兴趣的是5次都是正面和5次都是反面的概率和,那么p_value是0.0625


image.png

我们在夸张点,我们有很多很多数据,需要用分布函数来表示(可以复习下抽样分布这一章),这是某个地区女性身高分布图,显然,在预测某人身高时,在142cm—169cm之间的概率是0.95
image.png

超过169cm的概率为0.025


image.png

不到142cm的概率为0.025
image.png

如果我们感兴趣的是不到142cmhe超过169cm的概率和,那么p_value为0.05
讲到这里,p_value即是我们感兴趣的事件发生的概率,往往利用p_value去判断小概率事件发生的概率,往往用于假设检验中

显著性阈值

在假设检验中,我们计算的p_value,通常是和显著性阈值来相比的,比方说,我规定α = 0.05,那么当p_value < 0.05的时候,我们认为小概率事件在一次试验中发生,那么说明原假设有问题,该拒绝它。

你可能感兴趣的:(学习:StatQuest-p值及显著性阈值)