学点知识|这些词听起来像但根本就是两码事,可别被唬住了

学点知识|这些词听起来像但根本就是两码事,可别被唬住了_第1张图片

学点知识|这些词听起来像但根本就是两码事,可别被唬住了_第2张图片

题图:Paul Albertella / CC BY


有哪两种事物容易被人们混淆?


知友:大象(200+赞同,北京大学流行病学博士在读,医学话题优秀回答者,知乎编辑推荐)

有几个定量研究里面经常被混淆的概念。


  • 偏倚(Bias)和误差(Error)


误差分为系统误差和随机误差,而偏倚是指系统误差,因此我们说一个研究存在偏倚的时候,指的是研究中计算出的估计值与真实值之间存在系统误差。


经常有同学会问,如果线性回归的残差不满足独立,正态或者等方差的条件会不会导致偏倚?实际上,这些条件的违背只会影响对随机误差的估计,而不会增加系统误差,因此不会造成偏倚。


  • 偏倚(Bias)和缪误(Fallacy)


这个混淆经常出现在生态学缪误 (Ecological Fallacy)的语境中,很多人把生态学缪误归为偏倚的一种。


其实这是不对的,生态学缪误在于错误地把生态学层面的结论推论到个体水平,是一种结论解读的错误,而不是研究本身存在偏倚。


例如有人分别利用社区和个体级别的数据,研究了外来人口和自评健康得分的关系。


用社区水平数据的分析发现,外来人口比例高的社区,其平均自评健康得分也高。而个体水平上,是否是外来人口却与自评健康得分成负相关。


这两个研究本身都没有问题,但当把社区层面的结论地简单推论到个体水平时,就是发生了我们说的生态学缪误。


  • 无偏估计值和真值


无偏估计值和真值是两个不同的概念。这样的混淆经常出现在一些论文中,得到了一个正的回归系数,但标准误很大以至于统计学上不显著。


作者常解释说,因为研究控制了足够多的混杂因素或者使用了工具变量,所以点估计不受影响,进而开始解释这个回归系数的意义是什么。


实际上,点估计是一个变量,而无偏估计值是指点估计值的期望等于真值,而不是说当前研究里面得到的这个点估计就是一个稳定不变的真值。


  • 因果和相关


「相关不等于因果」和「脱离剂量谈毒性」已经成为知乎上评论区打脸的标配了,然而当讨论到因果和相关性强弱时,却又容易发生混淆。


比如研究中证实 A 与 B 存在因果关系,在排除了混杂因素的影响后,是不是 A 和 B 一定高度相关呢?


答案并不是,如果没有效应修饰作用,A 和 B 的因果关系是一个与人群无关的量,而相关性却会随人群变化而变化,如果在一个人群中 A 的取值都相同,A 和 B 的相关性为 0,但 A 和 B 的因果关系却总是存在的。


  • 效应强度和统计学显著


这类混淆在解释回归系数的时候可能会发生。统计学显著指的是 P 值小于一个预先设定的一类错误率 。


P 值的大小随样本量,效应强度变化而变化,P 值小不代表效应强度就大。有统计学意义,不一定效应强度就有实际意义。


  • 统计学显著和统计功效


这类混淆常发生在阴性结果的解读中。通常论文里会有这样的句子,A 组和 B 组的均值差异没有统计学意义(P=0.85),因此我们得出结论,A 组和 B 组没有差别。


实际上,P 值仅代表原假设成立时,观察到这样或更大均值差的概率,并不能告诉我们错误地接受原假设的概率是多少。


得到大 P 值可能是因为样本量小,要验证 A 组和 B 组没有差别,需要计算的是统计功效而不是 P 值。


  • 效应强度和证据强度


这个混淆很常见,一个因果关系的证据等级不能代表其效应强度的大小。因果关系的证据等级强弱和很多因素有关,包括了效应强度,更重要的是这个问题是不是重要的问题,以至于能有足够多和足够严谨的研究。


常见的混淆是认为 IARC 对致癌物的分级代表了致癌物效应的强弱,其实这个只是代表了证据是否充分而已。


又比如,心血管疾病危险因素的证据往往比较充分,而脱发的危险因素可能证据就不充分了,原因是研究脱发比研究心血管疾病难拿研究经费。


  • 假设(Assumption)和假设(Hypothesis)


这里的 Assumption 和 Hypothesis 在中文里有时候都叫假设,实际上假设和假设是完全不同的。


在一个研究里,Assumption 是你假定已经满足的前提条件,而 Hypothesis 是要检验的命题。


Assumption 可以是研究中不能证明的部分。比如用身高决定基因的多态性作为身高的工具变量,来研究身高与社会经济地位的关系。


这里就有三个 Assumption,身高的决定基因能决定身高,身高的决定基因不会通过其他因素影响社会经济地位,身高的决定基因只能通过身高来影响社会经济地位,其中后两个 Assumption 是无法用实证证明的。而这个研究中的 Hypothesis 是身高与社会经济地位有关。


戳小程序查看剩下的 195 个回答:有哪两种事物容易被人们混淆?


学点知识|这些词听起来像但根本就是两码事,可别被唬住了_第3张图片



一个北大毕业生决定去扮演外卖员

总是手脚冰凉,我的身体是不是出了问题?

花钱的方法有一万种,但最好的只有这一种

想快速提高拍照技术?看这一篇就够了

这个动作很伤害健康,但每个人都经常做


学点知识|这些词听起来像但根本就是两码事,可别被唬住了_第4张图片

你可能感兴趣的:(学点知识|这些词听起来像但根本就是两码事,可别被唬住了)