下一章 上一章 目录 设置
87、第十一章 工具变量 ...
-
当直接测量因果关系被内生性污染——当你想知道X是否导致Y,但X与误差项相关——你需要一个工具变量Z。Z必须满足:与X相关,且只通过X影响Y。在师父的案子里,1999年那两根断裂的肋骨,就是他从二十年前扔给沈默的工具变量。
场次六第二阶段回归
时间:2024年12月2日,夜晚22时10分
地点:省公安厅刑侦支队·侧写室
苏棠在Stata里输入第二阶段回归。
Y = β? + β?X + ε
样本:
Z=0 → X=0 → Y=0
Z=2 → X=12 → Y=1
她运行回归。
β? = (1-0)/(12-0) = 0.0833
她看着屏幕。
“师父每多接触1个证人,”她说,“死亡概率增加约8.33%。”
她顿了顿。
“1999年他接触了0个证人——他没死。”
她顿了顿。
“2004年他接触了12个证人——他死了。”
她看着沈默。
“这是工具变量法的估计结果。”
沈默没有说话。
他看着白板上那行公式。
β? = 0.0833
8.33%。
师父每多查一个人,死亡风险增加8.33%。
刘宝根、赵大河、李老根、王老四——
师父查了他们,他们死了。
师父自己也死了。
苏棠:“这个估计是有偏的。”她说。
她顿了顿。
“因为样本太少。”
她顿了顿。
“因为我们不知道Z=1和Z=3的反事实结果。”
她顿了顿。
“因为我们无法排除其他混杂因素。”
她看着沈默。
“但这是目前唯一可用的工具变量。”
她的声音很低。
“1999年那两根肋骨,是师父留给你的——”
她顿了顿。
“唯一的Z。”
沈默看着屏幕上那行数字。
0.0833。
二十年。
他算了二十年,终于算出一个数字。
这个数字告诉他——师父当年如果少查一个人,也许就不会死。
他查了12个。
他死了。
如果1997年他当上了副局长,他可能1997年就会去查石门石英砂厂。
如果1997年他查到了周培德持股20%,他可能1997年就会被马忠林打。
如果1997年他被打断了肋骨——
X=12。
Y=1。
他还是会死。
1997年,还是2004年。
师父从周明远那里听到“陈主任”的那一刻,他的死亡概率就已经固定了。
工具变量只是把这个概率算了出来。
0.0833。
苏棠:“工具变量的局限性。”她说。
她看着沈默。
“它只能估计局部平均处理效应。”
她顿了顿。
“它只能告诉我们,在‘因为1999年受伤而追查更深’的那群人里,追查对死亡的影响。”
她顿了顿。
“它不能告诉我们,如果1999年师父没受伤,他会不会2004年依然追查——会不会依然死。”
她看着沈默。
“工具变量不是魔法。”
她的声音很轻。
“它只是一个——从二十年前扔过来的证据。”
沈默点头。
“我知道。”他说。
他关掉Stata。
“师父1999年被打断两根肋骨。”
他看着苏棠。
“他不是因为追查周明远被打的——1999年他查的是石门石英砂厂。”
他顿了顿。
“他被打,是因为查到了周培德持股20%。”
他顿了顿。
“周培德持股20%,是因为周明远需要82万。”
他顿了顿。
“周明远需要82万,是因为1997年他挪用了扶贫资金给陈某某。”
他顿了顿。
“陈某某需要那笔钱,是因为他想当副主任。”
他顿了顿。
“他想当副主任,是因为陆某某手里有那个位置。”
他看着苏棠。
“1999年那两根肋骨,是这条因果链上第一个——也是唯一一个——可观测的、外生的、不可篡改的证据。”
他顿了顿。
“师父把它留给我了。”