下一章 上一章 目录 设置
82、第十一章 工具变量 ...
-
当直接测量因果关系被内生性污染——当你想知道X是否导致Y,但X与误差项相关——你需要一个工具变量Z。Z必须满足:与X相关,且只通过X影响Y。在师父的案子里,1999年那两根断裂的肋骨,就是他从二十年前扔给沈默的工具变量。
场次一 工具变量的定义
时间:2024年12月2日,上午8时整
地点:省纪委·第七纪检监察室会议室
方卫东在白板上写下三行字。
Y:师父的死亡(2004.7.11)
X:周明远被查(2004.5-7)
Z:?
他搁下笔。
“二十年来,”他说,“我们一直在试图证明X导致Y。”
他顿了顿。
“周明远被查,导致陈山河死亡。”
他看着沈默。
“但这条因果链被严重的内生性污染。”
方卫东在白板上写下:
内生性来源1:遗漏变量
——陈某某、陆某某、1997年那247万
内生性来源2:反向因果
——周明远被查是因为师父查他;师父查他是为了什么?
内生性来源3:测量误差
——师父死亡时间被篡改,死因被篡改,证据被销毁
他转过身。
“直接回归Y~X,系数是有偏的。”
他顿了顿。
“我们需要一个工具变量。”
会议室里很安静。
苏棠开口。
“工具变量的核心条件是两条。”
她走到白板前。
条件1:相关性——Z与X相关
条件2:外生性——Z只通过X影响Y,且Z与误差项不相关
她看着方卫东。
“这个案子里,有符合这两个条件的Z吗?”
方卫东没有回答。
他看着沈默。
沈默坐在那里。
很久。
他开口。
“1999年冬天。”他说。
他的声音很平。
“石门村。石英砂厂。”
他顿了顿。
“师父去查账。马忠林把他打倒在地。”
他顿了顿。
“左侧第三、第四肋骨——陈旧性骨折。开棺验尸时苏棠发现的。”
他看着方卫东。
“那是师父1999年受的伤。”
方卫东没有打断他。
沈默:“1999年那82万,是周明远替陈某某还债。”
他顿了顿。
“师父查到的是石门石英砂厂的账目异常。”
他顿了顿。
“他被打断两根肋骨。”
他顿了顿。
“马忠林顶罪入狱。”
他顿了顿。
“周培德什么都没说。”
他顿了顿。
“陈某某什么都没发生。”
他看着白板上那个空白的Z。
“1999年师父被打——”
他的声音很低。
“这件事,和2004年师父的死——”
他顿了顿。
“是同一个因果链条的两端。”
苏棠的笔停住了。
她看着沈默。
“你的意思是——”
沈默:“1999年的袭击,是2004年谋杀的工具变量。”
他顿了顿。
“1999年师父查石门石英砂厂——查到了周培德持股20%,查到了那82万亏空。”
他顿了顿。
“他被打断两根肋骨。”
他顿了顿。
“2004年师父查周明远——查到了周明远背后的陈某某。”
他顿了顿。
“他被毒死。”
他看着苏棠。
“这两次调查,是同一件事。”
他顿了顿。
“1999年师父没死,是因为马忠林认罪了。”
他顿了顿。
“2004年师父死了,是因为陈某某需要他死。”
他顿了顿。
“但1999年那两根肋骨——”
他看着方卫东。
“是1999年到2004年之间,师父唯一留下的、无法被篡改的证据。”
方卫东点头。
“Z必须是外生的。”他说,“1999年那场袭击,不受2004年师父死亡时的任何因素影响。”
他看着沈默。
“1999年马忠林的拳头,不是2004年陈某明的毒药。”
他顿了顿。
“这符合外生性。”
沈默:“相关性呢?”
苏棠替他回答。
“1999年的袭击,与师父2004年的死亡概率相关。”
她顿了顿。
“因为那场袭击,是师父第一次触及周明远-陈某某利益链的证据。”
她顿了顿。
“如果1999年师父没有被打——”
她顿了顿。
“他可能不会在2004年继续追查这条线。”
她顿了顿。
“他可能不会死。”
她看着沈默。
“相关性成立。”
会议室里安静了很久。
方卫东开口。
“工具变量找到了。”
他看着白板上那个空了三年的Z。
Z:1999年陈山河被袭击事件
他写下来。
“两阶段最小二乘法。”他说。
“第一阶段:用Z估计X——1999年被打的严重程度,如何影响2004年师父追查周明远的深度。”
“第二阶段:用X的预测值估计Y——追查深度如何影响死亡概率。”
他放下笔。
“沈默,”他说,“你需要量化这两个变量。”
沈默点头。
“1999年被打的严重程度——”
他顿了顿。
“左侧第三、第四肋骨骨折。暴力钝器伤。愈合时间约二十年。”
他看着方卫东。
“这是X光片可以证明的。”
他顿了顿。
“2004年追查周明远的深度——”
他顿了顿。
“师父2004年5月到7月接触过的证人数量。”
他顿了顿。
“刘宝根、赵大河、李老根、王老四、刘三女、李德厚、王桂芬、张万有——”
他顿了顿。
“还有周培德、赵明亮、李翠芬。”
他看着方卫东。
“11人。”
他的声音很低。
“1999年他被打断两根肋骨。”
他顿了顿。
“2004年他接触了11个证人。”
他顿了顿。
“2004年7月11日,他死了。”
他看着白板上那行公式。
Y = β? + β?X + ε
X = π? + π?Z + ν
“β?是多少?”他问。
没有人回答。
这个系数,要他来算。