4、如何解决内生性问题
产生内生性问题的原因很多,共时性问题、遗漏变量问题,联立方程偏差问题都能带来内生性问题。
该如何解决内生性问题?
1)使用但不迷信工具变量。
工具变量需要满足两个条件:一是相关性,二是排他性。相关性比较容易满足,排他性则比较难以满足。一个合格的工具变量必须和处理内生变量高度相关,同时又对因变量没有直接作用,也就是说能够影响工具变量的只有工具变量,工具变量不应直接影响结果变量。这个要求确实很难满足。
比如把殖民地的死亡率作为制度的工具变量,然后得出结论:制度会影响长期经济增长。然而殖民地的死亡率高,意味着当地的自然环境比较差。我们早就知道“自然环境比较差的地方经济表现不好”,因此很难排除殖民地的死亡率通过其他途径直接影响长期经济表现的可能性。要解决这个问题,就需要从其他方面着手,你就要通过其他方面来想办法,做无数的回归。我曾辅导一名硕士生做过类似的尝试,刚开始的时候我们使用工具变量,后来从其他方面入手,开始多做一些回归,逐渐解决了这个问题。
2)如果有面板数据,可以借此打个时间差。
面板数据代表时间上的变化。所谓“外生性”,指先发生的事情相对于后发生的事情而言,一定是外生的,除非它们长期受到第三方因素的影响。倘若有面板数据,长期影响就可以被固定下来,成为固定效应。这时候就可以把X变量作为外生性变量。
关于面板数据的应用技巧还有很多。我的一位硕士生——徐轶青,做得非常好,如今是斯坦福大学政治系教授。轶青在硕士期间做的硕士论文,博士期间不断修改,最终发表在政治学最好的杂志上。这篇文章的焦点之一是“如何度量非正式制度”这一内生性很强的问题。当时我们想的办法是用村庄级别面板数据的特点,利用村庄内部的变化,看选举如何激活宗族这个非正式制度。村庄选举出的村主任来自最大姓,说明他拥有了宗族赋予的非正式权威。只要选举比较随机,我们就可以认为说这是外生的。
断点回归也是一种解决办法,可以就此找到很多切入口。
我有一位来自北大马克思主义学院的学生,他用中央苏区作为断点回归,我认为这是个很好的办法。如果能辅以自然实验或者拟自然实验,效果会更好。
因此,做经验研究一定要从多个方面验证自己的结论,要知道经验研究只是检验了一个理论预测,现有数据支持理论预测,不等于理论就是对的,因为可能存在其他理论,其结论也和经验发现一致。也就是说,能够得出同样结论的理论模型可能不止一个,其他机制也有可能推导出同样的结论。所以经验研究一定要找到排除其他理论的解释,此外也要时常扪心自问:做的这些回归能否支撑结论?经常做一些符合直觉或理论差异化效果的检验,构建反事实检验也是必要的步骤。
做经验研究时,同学们要时刻想象有一位审稿人坐在你面前,追问你各种问题,你要想方设法用计量结果回答他。“假想审稿人”不一定会挑战你故事中的细节,但他可能会挑战你使用的方法。