本文由《万物》杂志官方微信
“把科学带回家” 提供
参考资料 The Book of Why: The New Science of Cause and Effect等
编译 七君
第一次听说辛普森悖论(点我查看)的人,会对人生产生怀疑。但是有一个经典的统计学悖论,第一次听说的人也会感到异常迷惑。而且这个悖论,和我们的日常生活息息相关。
现在大部分人都知道吸烟会导致肺癌,对孕妇和胎儿也有害。但是在50年前,一些著名科学家曾经认为,吸烟对某些胎儿有好处,而美国政府甚至在1984年之前不允许宣传“吸烟导致肺癌”。这到底是怎么回事呢?
50年的悖论:吸烟对胎儿有利?
事情要从50年前说起。
在20世纪50年代的时候,有不少证据指出,吸烟会导致肺癌。可是在60年代的时候,一些研究发现,如果孩子生下来的时候体重过轻,那么母亲吸烟对孩子反而是件好事,这就是经典的出生体重悖论(birth-weight paradox)。
对我们来说这个现象显然违背基本常识,但要注意,我们的“常识”建立在科学界的共识上。在当时,科学界针对这个诡异的现象,站成了两派。
加州大学伯克利分校的生物统计学家 Jacob Yerushalmy 就是赞同吸烟对体重过轻的婴儿有好处的那一派。
1959年,Jacob Yerushalmy 主持了一项大型的长期研究,他收集了超过1.5万名旧金山湾区儿童的数据,包括他们出生体重、他们的母亲是否吸烟等。
当时科学家们已经知道,吸烟的母亲生下的孩子的体重比不吸烟的母亲要低。而美国的一项全国性研究也发现,低出生体重(LBW)的婴儿在人生头年的死亡率是正常体重婴儿的20倍。所以,我们很容易得出这样的因果逻辑链:
母亲吸烟——>婴儿出生体重偏低——>婴儿死亡。
本身是烟民的 Yerushalmy 就想看看,这个因果关系到底成不成立。但是,数据给出的结果却出乎许多人的意料:吸烟母亲生下的LBW婴儿的死亡率要比不吸烟的母亲生下的LBW婴儿低。
换句话说,如果只看LBW婴儿,我们就会得出这样一个结论:母亲吸烟反而有好处。
在报告这个悖论时,Yerushalmy 写道:“这个悖论的发现驳斥了吸烟有害胎儿健康的观点。”如果吸烟真的对胎儿有害,那要怎么解释这个令人困惑现象呢?
出生体重悖论在近50年的时间里难倒了许多生物学家和统计学家,许多人甚至把它看成出生体重特有的矛盾。
在2001年发表在 International Journal of Epidemiology 上的一项研究中,美国国立环境卫生研究所生殖流行病学小组组长、流行病学家 Allen J Wilcox 指出,后来越来越多的证据驳斥了 Yerushalmy 的观点,证明吸烟对母婴是有害的,比如吸烟会影响氧气通过胎盘的传输,出生时体重较轻的人日后患有哮喘、高血压,或者智商更低的可能性也更高。
因为出生体重能预测婴儿未来身心健康的许多方面,因此在美国,增加出生体重就成为减少婴儿死亡率的一大举措。但是,出生体重悖论却一直没有被解决。
直到2006年,波士顿大学和美国国家儿童健康和人类发育研究所的研究者发表在《美国流行病学杂志》(American Journal of Epidemiology)上的一项研究才提出了令人信服的解释。原来,吸烟的确会导致LBW,但是LBW的成因并不只有母亲吸烟一个。
许多更严重的疾病也会造成LBW,比如基因缺陷或者营养不良。这样一对比,在所有LBW的原因中,吸烟算是伤害点比较小的那个了。
反过来说,如果LBW的孩子母亲不吸烟,那么造成LBW的原因往往比吸烟更严重,因此孩子的死亡可能性也更高。
话说回来,类似的悖论在生活中层出不穷。
再举个例子,医学研究发现,酒精成瘾和肝癌都会造成血液中的转氨酶升高。转氨酶是肝脏的一种重要蛋白质,如果肝脏受损,那么血液中转氨酶的浓度就会上升。
但奇怪的是,在转氨酶比较高的患者中,酒精成瘾的人的短期死亡率反而比不喝酒的人要要低。
这个悖论的解法也是一样的:如果你不喝酒,那么如果你转氨酶升高,更可能的原因就是肝癌。
这些悖论告诉我们,分辨因果关系是多么困难的一件事,哪怕是常年和数据打交道的科学家们也无法轻易下结论。
幸存者偏差
出生体重悖论和酒精成瘾悖论让许多人感到不寒而栗:用日常生活中的现象得出的经验啊、因果关系啊会不会都是假象呢,我们有什么办法能够辨明真相呢?
想要获得真相,也就是真正的因果关系,就必须要先来了解一下对撞因子偏误(collider bias)。实际上,出生体重悖论是对撞因子偏误的完美案例。
对撞因子是啥玩意儿?
简单来说,假设我们观察到了现象X和Y,我们想要确认它们之间有没有因果链,那么对撞因子就是能被X和Y影响的另一个因素。
对撞因子画成图就是这样的——
很多时候,我们觉得X好像是Y的原因,但实际上两者可能没有关系,真正的幕后推手是隐藏的对撞因子。
举个最著名的例子——幸存者偏差。
二战期间,盟军从战区飞回来的飞机中,机翼上的弹痕最多,机尾和引擎最少。许多人据此得出结论:应该加强机翼,因为你看机翼的弹孔最多嘛。
但是匈牙利数学家、美国哥伦比亚大学教授沃德·亚伯拉罕(Wald Ábrahám)却认为,要加强机尾和引擎,因为这些部位被打中的飞机根本飞不回来。事实证明果然如他所料。
在这个例子里,X就是“中弹部位”,Y是“中弹数量”,“幸存”就是对撞因子。在飞回来的飞机里,中弹部位和中弹数量的确有相关性,因为你看机翼中弹多,机尾和引擎少嘛。
但实际上中弹部位和中弹数量没有因果关联,你看电影里打飞机的时候大家都是一顿乱射嘛,只不过它们都可以决定飞机是否能幸存,因而出现了虚假的相关性。
亚伯拉罕明白,所有上过战场的飞机各处弹孔数量是随机的,为什么单单飞回来的飞机都是打在机翼上呢?显然没能飞回来的都打在其他部位了嘛。
在科学研究和日常生活中,幸存者偏差层出不穷,所以如果只看那些没死的病人、有钱人、成绩好的人有什么什么特点,很容易就得出错误的结论。
当然,破坏X和Y之间因果链的不止对撞因子,还有干扰因子等,它们都属于可爱又迷人的反派、贯彻爱与真实的邪恶的潜变量,我们在介绍辛普森悖论的时候就简单提到过,有兴趣的可以再回顾一下(点我)。
如何证明吸烟导致肺癌?
有趣的是,正是潜变量的可能存在,美国政府到了1984年才出台了Comprehensive Smoking Education Act(全面烟草教育法案),开始允许宣传“吸烟导致肺癌”。
1984年的全面烟草教育法案出台后,美国售卖的香烟上出现了美国卫生部医务总监的警告:吸烟导致肺癌、心脏病、慢性阻塞性肺疾病、妊娠并发症。
@wikipedia
这背后的逻辑其实和出生体重悖论,以及幸存者悖论是一样一样的。既然有一个潜变量致使不能简单地推导出“吸烟导致婴儿死亡”这个说法,那么,是否也存在一个潜变量能够完美拆解“吸烟导致肺癌”这个因果链呢?
你想啊,要是存在某个基因,它让你容易烟草上瘾,也让你容易患肺癌,那么吸烟导致肺癌这个说法就站不住脚了啊,是你爸妈没有把你生好才是本质。
烟草公司当然希望把锅丢给你的基因,或者其他什么潜变量。而著名的统计学家、现代统计学的奠基者之一罗纳德·艾尔默·费希尔(Ronald A. Fisher)也是这种看法的坚定支持者。
罗纳德·艾尔默·费希尔(Ronald A. Fisher),他并不是因为吸烟而毛发茂密。
科研绕不开的统计工具、理科生普遍要学的方差分析就是大神费希尔的发明,对了费希尔本人是老烟枪,所以利益相关。为此,费希尔还在1957年写信给宣传吸烟导致肺癌的《英国医学杂志》(the BMJ),声称这是统计文盲在制造恐慌。
因为统计学大佬亲自为烟草站台,所以当时科学界也在这个问题上抓耳挠腮,争论了数十年。
有人可能会说,要是科学研究都可以被潜变量解释,那岂不是所有研究结果都要存疑了?
是这样子,但是我们也有建立因果逻辑链的简单粗暴的方法,那就是随机双盲实验。
比如,用丢硬币的方式,让某人吸烟或者不吸烟,然后过一段时间观察他们的死亡率,“吸烟导致肺癌”这个问题就可以被轻松证明或证伪。你细品一下,二战时的幸存者飞机、吸烟的人、医院里的肺癌病人,实际上都不是随机双盲的结果,所以用他们来推导原因是很困难的。
但问题在于,让人类去当小白鼠是不道德的,所以研究者不能做这样的实验,拿不到直接的证据,只能根据自然的吸烟者和不吸烟者的差别进行研究。这也是为什么,美国要花这么长时间才允许宣传吸烟有害。
你可能会问,既然不能拿人类做实验,那么最后是怎么确认这个因果链的呢?
实际上,吸烟和肺癌之间的因果链的确认,靠的是大量研究证据,以及敏感度分析(sensitivity analysis)等新一代的统计模型。大量的实验研究逐一推翻了不可能的潜变量,最终说服和绝大部分科学家和政策制定者,确立了吸烟和肺癌之间的因果链。
“吸烟导致肺癌”只有6个字,但是这6个字的证明过程却这么复杂,没想到吧!
根据亚伯拉罕的思路我们明白,看到学习后脱发了就给头部大量使用防脱洗发水是不对的,应该用防脱洗发水加强鼻毛和腋下才对。
关注:把科学带回家,有你想看的科普。