控制混杂,找到真正的夜里猛

众所周知,中国有五十六个民族。其中,五十五个民族喝醉酒就载歌载舞,只有汉族一喝酒就吹牛逼。前段时间,我和一群喜欢看金鱼的伙伴们就在深夜酒后吹牛逼。

酒过三巡,某大哥一个招呼不打,突然就把车开上了高速。还好我也是拿了驾照多年的老司机,虽然说没上过高速飙车,但是我也是淡定地坐稳了车。大哥感慨白天男子汉,晚上汉子难,好想吃多几颗vivo,充电五分钟,续航两小时。我纠正大哥那是OPPO,而且那是手机,不是夜里猛。这时候,酒桌上一位搞过运动医学的大佬开口,他说:“深蹲是男人的发电机。深蹲可以锻炼某核心肌群,提高续航能力。中国古代房中术中,有一个动作也有这个作用——站桩。”作为ETC转世的我,显现出了祖传的自动抬杠属性:

“那么这时候我就要质疑了。我们知道,续航能力是跟海绵体充血的程度密切相关。而血脂含量又会影响血液流动。通过运动锻炼,可以有效地降低血液中血脂含量,提高血流速度。那么,究竟是深蹲提高了续航能力,还是说只要有运动锻炼,就能提高续航能力呢?这对于我们想观察的暴露X(深蹲)对于结局Y(续航能力)的影响有很大的影响,算一个混杂因素。我觉得需要做广义线性模型对混杂进行控制,才可以正确地描述X对于Y的独立作用大小。简单的站桩有那么大好处,反正我是不信的。”

这时候,大家都觉得,我虽然年纪最小,但是说的很有道理。于是,大家一起把我打了一顿后就回家了。

通过这个故事,我们不难理解,混杂没有控制好,结果就会很难看。混杂是什么?混杂是在数据分析中,对X和Y关系造成影响的因素。混杂可以改变X和Y的关系,也可以改变X对于Y的作用。当某个因素和X有关系,又和Y有关系,那么就会形成混杂。混杂是多个方向的,它可以让没有联系和X/Y出现表面上的联系;它也可以让有联系的X/Y出现表面上的无联系或者反方向的联系。有时候,混杂可以放大或者缩小X与Y的作用。不难看出,婊里婊气的混杂其实就是X/Y这对关系中的第三者,还特么双性恋的那种。所以,情感专家鲁迅曾经发出这样的感慨:防火防盗防小三,流行分析控混杂。控制混杂是流行病学分析的首要问题。

那么平时都有什么办法防小三呢?有钞能力的人就直接开展随机对照试验,通过随机的方式来控制混杂。反正我都随机了,要错一起错,等于大家都没有错。而爸爸不姓马的朋友们,暗中观察,然后用统计的方法统一统,来控制混杂。常用的统计方法都有哪些呢?比如说,可以采用多元回归模型,通过调整协变量,来计算出X对于Y的独立作用大小。或者可以采用倾向性评分的方法。当然,还有其他方法。但是我不会了呢。这个时候,就需要统计学专家的介入啦。这就是为什么一个成熟的科研团队,一定要有统计学或者流行病学专家的原因。

好,又哔哔了一次,我去床上躺着休息先,脚有点软。昨晚在宿舍练习站桩,身体有点吃不消。

你可能感兴趣的:(控制混杂,找到真正的夜里猛)