题图:Paul Albertella / CC BY
有哪两种事物容易被人们混淆?
知友:大象(200+赞同,北京大学流行病学博士在读,医学话题优秀回答者,知乎编辑推荐)
有几个定量研究里面经常被混淆的概念。
偏倚(Bias)和误差(Error)
误差分为系统误差和随机误差,而偏倚是指系统误差,因此我们说一个研究存在偏倚的时候,指的是研究中计算出的估计值与真实值之间存在系统误差。
经常有同学会问,如果线性回归的残差不满足独立,正态或者等方差的条件会不会导致偏倚?实际上,这些条件的违背只会影响对随机误差的估计,而不会增加系统误差,因此不会造成偏倚。
偏倚(Bias)和缪误(Fallacy)
这个混淆经常出现在生态学缪误 (Ecological Fallacy)的语境中,很多人把生态学缪误归为偏倚的一种。
其实这是不对的,生态学缪误在于错误地把生态学层面的结论推论到个体水平,是一种结论解读的错误,而不是研究本身存在偏倚。
例如有人分别利用社区和个体级别的数据,研究了外来人口和自评健康得分的关系。
用社区水平数据的分析发现,外来人口比例高的社区,其平均自评健康得分也高。而个体水平上,是否是外来人口却与自评健康得分成负相关。
这两个研究本身都没有问题,但当把社区层面的结论地简单推论到个体水平时,就是发生了我们说的生态学缪误。
无偏估计值和真值
无偏估计值和真值是两个不同的概念。这样的混淆经常出现在一些论文中,得到了一个正的回归系数,但标准误很大以至于统计学上不显著。
作者常解释说,因为研究控制了足够多的混杂因素或者使用了工具变量,所以点估计不受影响,进而开始解释这个回归系数的意义是什么。
实际上,点估计是一个变量,而无偏估计值是指点估计值的期望等于真值,而不是说当前研究里面得到的这个点估计就是一个稳定不变的真值。
因果和相关
「相关不等于因果」和「脱离剂量谈毒性」已经成为知乎上评论区打脸的标配了,然而当讨论到因果和相关性强弱时,却又容易发生混淆。
比如研究中证实 A 与 B 存在因果关系,在排除了混杂因素的影响后,是不是 A 和 B 一定高度相关呢?
答案并不是,如果没有效应修饰作用,A 和 B 的因果关系是一个与人群无关的量,而相关性却会随人群变化而变化,如果在一个人群中 A 的取值都相同,A 和 B 的相关性为 0,但 A 和 B 的因果关系却总是存在的。
效应强度和统计学显著
这类混淆在解释回归系数的时候可能会发生。统计学显著指的是 P 值小于一个预先设定的一类错误率 。
P 值的大小随样本量,效应强度变化而变化,P 值小不代表效应强度就大。有统计学意义,不一定效应强度就有实际意义。
统计学显著和统计功效
这类混淆常发生在阴性结果的解读中。通常论文里会有这样的句子,A 组和 B 组的均值差异没有统计学意义(P=0.85),因此我们得出结论,A 组和 B 组没有差别。
实际上,P 值仅代表原假设成立时,观察到这样或更大均值差的概率,并不能告诉我们错误地接受原假设的概率是多少。
得到大 P 值可能是因为样本量小,要验证 A 组和 B 组没有差别,需要计算的是统计功效而不是 P 值。
效应强度和证据强度
这个混淆很常见,一个因果关系的证据等级不能代表其效应强度的大小。因果关系的证据等级强弱和很多因素有关,包括了效应强度,更重要的是这个问题是不是重要的问题,以至于能有足够多和足够严谨的研究。
常见的混淆是认为 IARC 对致癌物的分级代表了致癌物效应的强弱,其实这个只是代表了证据是否充分而已。
又比如,心血管疾病危险因素的证据往往比较充分,而脱发的危险因素可能证据就不充分了,原因是研究脱发比研究心血管疾病难拿研究经费。
假设(Assumption)和假设(Hypothesis)
这里的 Assumption 和 Hypothesis 在中文里有时候都叫假设,实际上假设和假设是完全不同的。
在一个研究里,Assumption 是你假定已经满足的前提条件,而 Hypothesis 是要检验的命题。
Assumption 可以是研究中不能证明的部分。比如用身高决定基因的多态性作为身高的工具变量,来研究身高与社会经济地位的关系。
这里就有三个 Assumption,身高的决定基因能决定身高,身高的决定基因不会通过其他因素影响社会经济地位,身高的决定基因只能通过身高来影响社会经济地位,其中后两个 Assumption 是无法用实证证明的。而这个研究中的 Hypothesis 是身高与社会经济地位有关。
戳小程序查看剩下的 195 个回答:有哪两种事物容易被人们混淆?