2021 年因果关系方法论获得诺贝尔经济学奖啦!茫茫书海,却不知道自己该从何入手学习因果推断?今天,Brady Neal 博士给各位梳理一下如火如荼的「因果推断」主流教科书,以便帮你确定「意中人」!别人眼中的「圣经」可能是你的「天书」。此话不假,有些书之所以难懂,并不是作者写的不好,很可能是我们自己的知识背景和思维模式与作者的存在较大的差异,以至于彼此「相看两厌」。
事实上,通过读书学习某些新东西,又如选择合适的道路登山。你若经验丰富,自然应该选择严峻的「捷径」,省了时间,也多了挑战的乐趣;你若追求闲庭阔步,自然应该选择滑坡而行,虽然慢,但却可以尽览沿途美景。前者对应的书籍会采用大量简洁的数学公式,而后者则更多是图文并茂,辅以浅显易懂的小例子。当然,后者有时候会略显繁琐,但却是初学者的福音。
我们先列出今天要介绍的「八大金刚」,随后逐一评价。
小测试:你需要修炼到哪个层次?
别着急,先做个小测试吧,看看自己最适合先从哪本书开始阅读 ( 以下测试根据博主 Neal 文章中的流程图改编 )。
Source: Which causal inference book you should read
[ ] 快速入门 - B1-Pearl2016
[ ] 深入学习 - B2-Peters2017
[ ] 是 - B2-Peters2017
[ ] 否 - Q3
[ ] 基础理论 - Q4
[ ] 应用 - Q5
[ ] 中立 - Q8
[ ] 喜欢 - Q6
[ ] 不喜欢 - B3-Imbens2015 OR B4-Rosenbaum2010
[ ] 中立 - Q8
[ ] 流行病学 - B5-Hernán2020
[ ] 社会科学 - B6-Morgan2014
[ ] 计量经济学 - B7-Angrist2009
[ ] 想 - B1-Pearl2016
[ ] 不想 - Q7
[ ] 是 - B8-Pearl2009
[ ] 否 - B2-Peters2017
[ ] 统计推断 ( statistics ) - B3-Imbens2015 OR B4-Rosenbaum2010
[ ] 机器学习 ( machine learning ) - B2-Peters2017
[ ] 因果图 ( causal graphs ) - B1-Pearl2016
[ ] 流行病学 ( epidemiology ) - B5-Hernán2020
[ ] 社会科学 ( social sciences ) - B6-Morgan2014
[ ] 计量经济学 ( econometrics ) - B7-Angrist2009
书籍详解
⭕ B1-Pearl2016: Causal Inference in Statistics: A Primer ( Pearl et al., 2016 )
这本书对于初学者来说再好不过,对因果推断和合成控制法有清晰明了的介绍,语言较为直白,少有公式或代码,可读性高。第一作者 Pearl 是 UCLA 计算科学的教授,曾获图灵奖,对因果推断做出了许多重要贡献,开创了基于有向图结果的因果推断。作者的另一本书《为什么:关于因果关系的新科学》 ( The Book of Why: The New Science of Cause and Effect ) 或许更为大家所知,感兴趣的读者可以阅读。
豆瓣用户评论“全书一共四章,前两章比较基础,介绍了所有 CI 最基本的理论部分。第三章 intervention,第四章 counterfactual 是属于比较深入的话题。这本书弥补了 book of why 里的技术细节,所有的概念也经由数学语言严格化,解决了很多 book of why 里泛泛而谈造成的细节缺失……”
⭕ B2-Peters2017: Elements of Causal Inference: Foundations and learning Algorithms ( Peters et al., 2017 )
“总结了近年来比较前沿的因果推断研究结论,大量篇幅用于证明和形式化描述定理、引理、结论等”,不太适合初学者,适合有机器学习背景的人学习,该书甚至有两章专门讨论因果推断与机器学习之间的联系。综合来说,这本书包含了其他书通常不会涉及的因果发现 ( causal discovery ) ,因而可能是学习现代因果发现 ( modern causal discovery/ structure learning ) 技术最好的书,能为后续结构因果模型 ( structural causal models ,SCMs ) 的学习打下基础。
⭕ B3-Imbens2015: Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction ( Imbens & Rubin, 2015 )
厦门大学赵西亮老师认为“这本书应该是学习因果推断的圣经”。“如果让我为大家只推荐一本因果推断的书,那么它将是由斯坦福大学教授 Imbens 和哈佛大学教授 Rubin 合著的《Causal Inference for Statistics, Social, and Biomedical Science: An Introducation》,没有之一。两位作者分别是在计量经济学和统计学领域的大牛,相信各位对两位学者都不陌生,其中 Rubin 就是潜在结果框架的提出者,潜在结果框架有时也用 Rubin 的名字命名,称为 RubinCausal Model。”
豆瓣用户 Bing 评论“全书的主要内容是 RCM ( Rubin Causality Model ) ,也就是基于 potential outcome 概念的因果模型,以 Rubin 早中期的研究成果为主,大多数内容都以随机试验为主要数据场景。每章都有大量的理论说明和推导,并配合一个(小)数据分析的实例。主要内容是因果分析的随机试验准则,倾向得分,匹配,混淆因素,工具变量等。最新的一些方法如 DID,RDD 等等,据作者所言将准备交给下册。…… 全书传统统计理论研究色彩浓厚,逻辑缜密,推导细致严谨,但可能会让社会科学等其他领域的人望而生畏。”
⭕ B4-Rosenbaum2010: Design of Observational Studies ( Rosenbaum, 2010 )
亚马逊用户评论 “我不知道为什么没有人看过这本书,也不知道为什么它不受欢迎,但如果你对从观测数据 ( observational data ) 中收集到的信息感兴趣,那这本书是很值得推荐的。观测数据和实验数据不同,相较来说,对观测数据的研究旨在寻找非随机干预措施的效果。这一研究主题在医疗科学、教育和社会科学中很重要,因为在这些研究领域,很容易获得观测数据,并能从数据中得到某些问题的答案。”
⭕ B5-Hernán2020: Causal Inference: What If ( Hernán & Robins, 2020 )
该书由哈佛大学公共卫生院的两位教授合写,主要针对医学领域,比较简单易懂,也可以作为因果推断的入门教材。作者之一 Jamie Robins 对流行病学和因果推论的发展做出了重要贡献,图灵奖得主 Pearl 认为他的调整公式在其 1986 年论文中就隐含出现了(第一次在文献中可以看出该调整公式)。博主 Neal 认为这是他所有读过的书中最实用的一本,举例来说,这本书是唯一涵盖了“ positivity / overlap ”概念的书,而这是估计因果效应必须满足的重要条件。此书也是提到的几本书中唯一涵盖了如何估计结果模型 ( outcome models ) 和倾向得分匹配模型 ( propensity score models ) 的书。应该指出,这本书中有很大的篇幅用于介绍可在实践中使用的估计量。第一部分主要介绍的是无模型的因果推断;第二部分则介绍有模型的因果推断;第三部分是如何在复杂的纵向数据中进行因果推断。
⭕ B6-Morgan2014: Counterfactuals and Causal Inference: Methods and Principles for Social Research ( Morgan & Winship, 2014 )
这同样是一本非常实用的书,这本书篇幅较长,作者引用了社会科学中的许多实际例子,可以说是涵盖了经济学,计算机科学以及整个社会科学中因果推断文献的主题。作为一个喜欢抽象而不是举例的人,博主 Neal 认为此书部分章节稍显冗长,但能为我们提供丰富的参考文献,并提供这些论文的最关键细节。从内容上来看,这本书很好地结合了潜在结果 ( potential outcomes ) 和图形因果推断 ( graphical causal models ) 的观点,并进行了比较。此外,该书涵盖了基于条件的因果效应估计量 ( conditioning-based estimators of causal effect ) 的 3 种不同类别,并分别用相应章节进行讲解:匹配,回归和逆概率加权。其他章节则涉及了工具变量和前门调节变量等。
⭕ B7-Angrist2009: Mostly Harmless Econometrics ( Angrist & Pischke, 2009 )
不必多言,这本书想必学经济的各位都很熟悉了。如果你想了解经济学家是如何看待因果推断的,那这本书非常适合你。针对一系列问题:“较小的班级规模是否会提高学生的学习成绩?最低工资会减少就业吗?虐待妻子的人应该被逮捕吗?教育能提高多少收入?民主会促进经济增长吗?”,这本书展示了如何应用计量经济学方法回答这些因果问题。
总体来说,此书不太关注基于条件的估计量 ( 想想 backdoor adjustment ) 。相反,它着墨于准自然实验方法,比如说工具变量方法、双重差分方法、断点回归设计等等。由于没有特别复杂的数理推导过程,此书对数学不那么好的同学非常友好,中文翻译版有些地方可能不太容易理解,有条件的友友可以对照英文原版阅读哦。
由于这本书是 2009 年出版的,因此未涵盖诸如合成控制法之类的最新方法。想要阅读一本涵盖合成控制法的最新教科书,博主 Neal 推荐 Scott Cunningham 的“Causal Inference: The Mixtape”
。
安神还有一本《精通计量:从原因到结果的探寻之旅》 ( Mastering Metrics: The Path from Cause to Effect ) ,更适合初学者,两者搭配食用更佳哦!喜欢《功夫熊猫》的同学更不要错过哦!此外,还推荐厦门大学赵西亮老师撰写的《基本有用的计量经济学》。
⭕ B8-Pearl2009: Causality: Models, Reasoning, and Inference ( Pearl, 2009 )
对想成为 structural causal models ( SCM ) 专家的人,强烈推荐此书!书中有丰富的理论知识,不是很容易阅读。如果你没有学习过或没有强烈的动机去了解 SCM ,那此书几乎是不可读的。博主 Neal 认为网络上对于这本书的评价过于刻薄,应该指出,这些苛刻的评论多来自对该理论不太感兴趣的人。在阅读了一些比较入门的书籍并对因果关系有了一定了解之后,再来阅读此书,想必会有更为深刻的理解。若已经提前读过这本书,日后重读一遍也是非常有意义的。
⭕ 其他书籍推荐 博主 Neal 在原博文里还推荐了几本流程图里未涉及到的书籍:
详细内容参见连享会推文
Note:产生如下推文列表的 Stata 命令为:. lianxh 书
. songbl 书
安装最新版lianxh
/songbl
命令:. ssc install lianxh, replace
. ssc install songbl, replace