二、关于经验研究
1、好的数据是第一要务
如果只用省级数据或者国家层面的数据做研究,除非论文立意特别好,否则很难发表。
还有一种方法是自己收集数据。博士生们一定不要怕自己收集数据,我有好几位博士生都这样做。自己收集数据虽然辛苦,但此后很长一段时间的研究都可以吃这些数据的“老本”。因此,博士生要注意给自己建一座“城堡”,在获取独一无二的“垄断”地位的同时,也让别人无法“攻破”你的“城堡”。在我看来,“城堡”可以是独家数据,也可以是超强的研究能力,比如特别擅长写模型,熟练运用各种方法等。
作为一名研究者,以上这些学术素养,至少要具备一样,不然如何在学术界立足?
2、做经验研究也要讲一个故事
研究者必须找一个好的经济学问题。这或许是我的个人偏见,因为我不喜欢那种X怎么影响Y的简单逻辑。如果你的选题背后没有经济学内容支撑,那平日里接受的经济学训练意义何在?
我建议大家先用图表把数据看一遍,主要因果关系必须在平均意义上显著。这一点我曾反复强调,如果数据在平均意义上都不显著,你就别做了,那你是在拷问数据。你做的就是“稻草学问”,没有意义。
做经验研究最好也要有个理论模型,不是构建一个理论,而是要提出一个分析框架,分清解释变量和控制变量。否则等这个结论出来时,再回过头做合理化的解说就有可能走不通。
我们还要学会用回归来讲故事。只做一条回归远远不够,你可能要做一万个回归,最后从中挑选出十个,讲一个逻辑自洽的故事。切记不要放太多的回归结果,这样做容易暴露自己的逻辑漏洞,哪怕结论是显著的,有些逻辑链条可能接不上。
写文章有个诀窍,你给读者呈现什么,读者就会沿着你的思路去思考,因此没必要去把旁枝末节也放到文章里,你的文章应该只突出一个核心问题。
在这一过程中,我们也要避免cherry picking。所谓cherry picking就是对自己有利的都讲出来,对自己不利的就不讲。大家可能会说,刚才说的挑选十个回归,这难道不是cherry picking?我想说的是,如果这里面有cherry picking,那这个故事本身就有问题,你要重新选一个故事。
3. 关于估计方法
在计量研究中,通常有三种方法,即简化式估计、结构式估计和结构化估计。
简化式估计就是回归式之间没有内在联系。其优点是简单直接,看平均意义上的效果,对数据的要求也不高。在我看来,哪怕是简化式估计,也应该能够讲一个逻辑一致的故事,这个一定要记住。简化式估计的缺点是容易出现内生性的问题,无法研究太复杂的机制。
结构式估计是多条有内在关系的回归式。优点是可以用来讨论较为复杂的机制,缺点是对数据的要求较高。我的博士论文是做中国土地问题,当时威斯康星大学的要求是都要做结构式估计,这意味着必须得有理论模型,从模型里推导出回归,这个回归就非常复杂。
最近有家杂志邀请我审一篇文章,关于中国农村土地问题。这篇文章做的是简化式回归,没有任何内在逻辑,相关机制就表现不出来。
当然结构式估计对数据的要求比较高,发表也比较难。我们曾有一篇文章,评审人就认为理论模型写得非常好,但经验研究不好,数据无法支撑这样的估计,因此毙掉了这篇文章。由此可见,结构式估计不容易。但我还是鼓励大家尽量做,这是一个很好的训练,也有可能激励你真正地把经济机制搞出来。
还有一种做法是用模型做估计。其优点是可以解决内生性问题,可以用来做反事实检验。你可以先想好一个模型,然后用数据校准模型。接下来就可以用这个模型来做政策分析、反事实分析。这种方法对数据要求没那么高,对模型的要求高一些。缺点是容易陷入“套套逻辑”,结论高度依赖于这个模型的设计。所谓“套套逻辑”就是为了得到结论而修改模型,自己解释自己。
以上三种方法各有优缺点,大家使用的时候要小心。