“ 20世纪50年代末60年代初,统计学家和医生就整个20世纪最引人注目的一个医学问题产生了意见冲突:吸烟会导致肺癌吗?在这场辩论过去了半个世纪之后的现在,我们认为答案是理所当然的。但在当时,这个问题完全处于迷雾之中。”
为什么
作者: [美]朱迪亚·珀尔(Judea Pearl) / [美]达纳·麦肯齐(Dana Mackenzie)
出版社: 中信出版集团股份有限公司
副标题: 关于因果关系的新科学
原作名: The Book of Why : The New Science of Cause and Effect
译者: 江生 / 于华
出版年: 2019-7-1
页数: 374
定价: 69.00元
装帧: 精装
ISBN: 9787521705072
01
—
书比较厚,正文346页,注释26页。内容也相对硬核,有一些概率、逻辑的公式,有一些偏哲学的思考。
以为会有许多因果关系的有意思的案例,结果比较失望,大部分内容是在讲因果关系判断的规则与技巧,重点的是用图来表示各因素关系的因果图,和作者总结的几个分析因果关系的公理。
作者说他这本书是关于“因果推断”这门新科学的普及著作。不过书的前后勒口、前沿后序中都没提这门新科学在学术界的地位,和作者在这门新科学中的地位。读后感觉是各学科科研论文中关于因果关系判断的规则与技巧的综述和作者在其中的看法与贡献,距离一门新科学还有距离,至少内容太少了。
前半部分主要讲如何根据数据推断出因果关系。有一类数据基本是充分必要条件,比如长期不吃维生素C和坏血病的关系,喝了霍乱杆菌污染的水和霍乱病的关系。但是更多的是多种因素可能都起作用的情况,这时如何判断因果呢?
前半部分有三个重要的多因素案例,一个是豚鼠的毛色跟豚鼠父母的毛色的关系,比孟德尔做实验的豌豆复杂得多,赖特用图形和数据分析得出的结论是:豚鼠毛色有42%的因素是遗传的。
第二个案例是肥料对庄稼的作用,可以把庄稼地分为多片,随机决定哪块地用哪种肥料,收获后分析肥料的优劣。
第三个案例是吸烟与肺癌的关系。涉及到人,不能随机让一组吸烟一组不吸烟,英美两国都启动了前瞻性研究,长期跟踪吸烟者的情况,跟不吸烟的群体做比较。
后半部分,因果关系推演的理论探讨和公式演示更多一些,比较有趣的是辛普森悖论,就是根据统计数据,一个新药对男性效果差,对女性效果差,但是综合男女数据则效果好。
总体评价3.5星。还可以,但是偏硬核偏学术,有概率学和逻辑学公式。
02
—
以下是书中一些内容的摘抄:
1:但今天,流行病学家、社会学家、计算机科学家以及一些开明的经济学家和统计学家开始频繁地提出这样的问题,并能够借助具有高度精确性的数学工具作答。对我来说,这种改变就是一场革命。我斗胆称之为“因果革命”,是因为这场科学剧变真正接纳了我们人类理解因果知识的认知天赋,而不再拒之于科学大门之外。P导言14
2:因果革命不是在真空中产生的;它背后有数学工具上的发展作为支撑,这种数学工具最恰当的名称应该是“因果关系演算法”。借助这种工具,我们得以解答一些有关因果关系的最棘手的问题。P导言14
3:事实上,我在机器学习方面的研究经历告诉我,因果关系的学习者必须熟练掌握至少三种不同层级的认知能力:观察能力(seeing)、行动能力(doing)和想象能力(imagining). P6
4:更为有趣并且即使在硅谷也鲜为人知的是,即便不进行实验,我们有时也能成功地预测干预的效果。例如,销售经理可以研发出一个包括市场条件在内的消费者行为模型。就算没能采集到所有因素的相关数据,他依然有可能利用充分的关键替代数据进行预测。P11
5:1980年,哲学家约翰·塞尔以“中文屋”(Chinese Room)论证介绍了这种作弊的可能性,以此挑战图灵的说法——伪造智能的能力就相当于拥有智能。塞尔的质疑只有一个瑕疵:作弊并不容易——事实上,作弊根本就是不可能的。即使只涉及少量变量,可能存在的问题的数量也会迅速增长为天文数字。P17
6:赖特的贡献是独一无二的,因为他得出结论(42%的遗传性)所需要的信息分属于两种截然不同的、几乎不相容的数学语言:一种是图形语言,另一种是数据语言。P57
7:20世纪60年代,事情开始发生变化。一群社会学家,包括奥蒂斯·邓肯、休伯特·布莱洛克,以及经济学家亚瑟·戈德伯格,重新发现了路径分析,将其视作预测社会政策和教育政策实施效果的有效方法。P63
8:路径分析在经济学和社会学中有着不同的命运轨迹,但两者最终都走向了对赖特思想的背叛。社会学家将路径分析改名为结构方程建模(structural equation modeling,简称SEM),他们接纳了其中的图形表示法,并将其广泛应用于各类研究 P64
9:经济学家几乎完全舍弃了路径图,且时至今日依然如此,他们更多地借鉴了数值方程和矩阵代数方面的内容。这样做的一个可怕后果就是,由于代数方程是没有方向性的(x=y与y=x相同),经济学家也就无法利用符号表示法来区分因果关系和回归方程,因此即使在解出方程之后,他们仍然无法回答与估计策略效果有关的问题。P64
10:这也许是贝叶斯法则在统计学中最重要的应用:我们可以在我们的判断较为可靠的一个方向上直接估算出条件概率,并利用数学工具推导出在我们的判断较为模糊的另一方向上的条件概率。在贝叶斯网络中,该方程也扮演了同样的角色:我们告诉计算机前向概率,在需要时,计算机告诉我们逆概率。P81
11:1993年,一位名叫克劳德·贝鲁的法国电信工程师震惊了编码世界,他开发的纠错码表现出了近乎最优的性能。(换言之,其所需的冗余信息的数量接近于理论最小值。)他的构思被称为“turbo码”,非常适用于通过贝叶斯网络来解释。P104
12:无论用哪种标准来衡量,turbo码都取得了惊人的成功。在“turbo革命"之前,2G手机使用的是“软解码”(概率),而不是信念传播。3G手机使用的是贝鲁的turbo码,4G手机使用的是加拉格的类turbo码。从消费者的角度来看,使用了新代码的手机耗能更少,电池续航时间更长,因为编码和解码是一部手机中能耗最大的部分。P106
13:正如我已经提到的,只有一种情况会让科学家不再沉默,转而谈论因果论,这种情况就是他们已经进行了随机对照试验。P120
14:因此,随机化实际上带来了两个好处。第一,它消除了混杂偏倚(它向大自然提出了正确的问题)。第二,它使研究者能够量化不确定性。而根据史学家斯蒂芬·施蒂格勒的说法,第二个好处正是费舍尔提倡随机化的主要原因。他是量化不确定性的大师,为此研发出了许多新的数学工具。P124
15:20世纪50年代末60年代初,统计学家和医生就整个20世纪最引人注目的一个医学问题产生了意见冲突:吸烟会导致肺癌吗?在这场辩论过去了半个世纪之后的现在,我们认为答案是理所当然的。但在当时,这个问题完全处于迷雾之中。P143
16:多尔和希尔意识到,如果病例一对照研究中的确存在隐藏的偏倚,那么仅仅靠重复研究肯定是无法消除偏倚的。因此,他们于1951年开始了一项前瞻性研究,向6万名英国医生发放调查问卷,采集关于其吸烟习惯的信息,并对他们进行追踪调查。(美国癌症协会也在同一时间发起了一项类似的、规模更大的研究。)在短短的5年里,一些戏剧性的差异就出现了。P149
17:答案是,在你选择了1号门之后,蒙提·霍尔就不能再打开它了——他本可以打开2号门,但他没有这样做,而是打开了3号门,这一事实表明他很有可能是不得不这样做的,因为2号门后面可能是汽车。因此,我们就有了比之前更多的证据表明汽车在2号门。P170
18:呼吸系统疾病和骨骼疾病(见表6.3)。在一般人群中,大约有7.5%的人患有骨骼疾病,这一比例与患者是否患有呼吸系统疾病无关。但是,对于患有呼吸系统疾病的住院患者而言,其骨骼疾病的患病率会升至25%!萨克特称这种现象为“住院率偏倚”或“伯克森偏倚”。P173
19:我们可以做一下这个试验:同时抛掷两枚硬币100次,只在至少一枚硬币正面朝上时记下结果。现在看一下你列出的结果表格,其中会包含大约75个记录,根据这些记录,你会发现两枚硬币的抛掷结果并不独立。每次当硬币1为反面落地时,硬币2必为正面落地。P174
20:你对约会对象的选择取决于两个因素:魅力和个性。你会冒险约会一个刻薄而有魅力的人,或者一个和蔼但缺乏魅力的人,你当然也会与既和蔼又有魅力的人约会,但你肯定不会与既刻薄又没有魅力的人约会。换句话说,你删掉了所有“负一负”的结果,这与你在抛掷两枚硬币的例子中所做的筛选是相同的,而正是这种筛选造成了魅力和个性之间的伪负相关。P175
21:近20年来,我一直在试图说服科学界,辛普森悖论所引发的困惑是出于错误地将因果原则应用于解释统计比例。而借助因果符号和因果图,我们就可以清楚明确地判断药物D是能预防心脏病发作还是会导致心脏病发作了。从根本上讲,辛普森悖论是一个关于混杂的难题,P177
22:1996年发表的一篇观察性研究报告表明,对于摘除小型肾结石而言,开腹手术比内窥镜手术的成功率高,对于摘除较大的肾结石而言,开腹手术也有更高的成功率。然而就总体而言,开腹手术的成功率反而较低。正如我们在第一个辛普森悖论的例子中所做的分析,在这个例子中,我们发现手术方式的选择与病情的严重程度有关:较大的肾结石更可能需要通过开腹手术来摘取,并且有较大肾结石的病人本身的预后也更差。P185
23:我承认我本人就曾对这一证明结果屏息以待。这一对于完备性的证明告诉我们,如果我们在规则1到3中找不到根据数据估计P(Y|do(X))的方法,那么对于这个问题,解决方案就是不存在的。在此情况下,我们就能意识到除了进行随机对照试验,我们别无选择。P212
24:大约在2005年,维尔穆斯和考克斯对一类被称为“序贯决策”(sequential decisions)或“时变处理”(time-varying treatments)的问题产生了兴趣。在医学治疗领域,这种问题很常见。以艾滋病治疗为例,通常,艾滋病治疗是在较长的一段时间内进行的,并且在每个治疗阶段,医生都会根据患者的实际情况调整后续治疗的强度和用药剂量。P215
25:不过,斯诺自有妙招。他注意到,在两家公司共同服务的地区中,由索沃公司供水的家庭,其死亡率仍然要高出许多,而这些家庭在瘴气和贫困方面与该地区的其他家庭没有什么显著的区别。P221
26:下面,我们来说明如何利用因果图来判断(条件的)可忽略性。以一组匹配变量Z为条件,要确定对于结果Y来说X是否可忽略,我们只需要测试Z是否阻断了X和Y之间的所有后门路径,同时,Z的成员都不是X的后代即可。就这么简单!P257
27:虽然“若非因果关系”已被普遍接受,但律师们已经发现,在某些情况下它可能会导致司法不公。一个典型的例子是“坠落的钢琴”,其中被告向受害者开了一枪,但没有击中。在受害者逃离现场的过程中,他碰巧被一架坠落的钢琴砸死了。使用“若非”测试,被告会被判犯有谋杀罪,P263
28:数学语言来说,艾伦和斯托特指的是约有90%的可能性FAR超过50%。或者可以这么说,约有90%的可能,在当前的二氧化碳水平下,像2003年欧洲夏天的持续高温这种异常天气事件的出现概率,要比在工业化之前的二氧化碳水平下,该事件的出现概率高出2倍多。请注意,我们在这里谈论的是两层的概率——概率的概率!P267
29:如果止血带能让更多的士兵在到达医院之前幸存下来,那么它就是一种非常有利的干预措施。这意味着止血带的作用是将病人活着送到医院;而一旦做到这一点,它就没有进一步的价值了。遗憾的是,数据没能提供任何信息(见表9.1)用以证实或反驳这个假说。P319
30:不过,我确实对深度学习的一个方面感兴趣,即其系统的理论局限性,其中最主要的局限体现在其无法超越因果关系之梯的第一层级。这一局限并不妨碍AlphaGo在狭隘的围棋世界中给出出色的表现,因为棋盘形式与游戏规则已经构成了关于围棋世界的一个充分的因果模型。P335
31:当我们开始谈论强人工智能时,因果模型就从奢侈品变成了必需品。对我来说,强人工智能应该是能反思其行为,并能从过去的错误中吸取教训的机器。它应该能够理解“我本应该采取不同的行为”这句话,无论这句话是由人类告诉它的还是由它自己分析得出的。P336
32:总之,我认为,能够给思维机器带来智能体效益的软件包至少包括3个组成部分:关于世界的因果模型;关于自身软件的因果模型,无论这个模型有多浅显;以及一个内存,用于记录其心理意图对外部事件的反应方式。P340
全文完
相关链接:
更多毒舌书评参见我的公众号:左其盛经管新书点评