关于《基本无害的计量经济学》中同伴效应与禁止回归的技术问询
同伴效应研究的经典误区:个体属性对群体均值回归的问题
我最近在研读Angrist和Pischke的《Mostly Harmless Econometrics》,刚好看到第146页讨论了一个同伴效应研究里很容易踩的坑,分享给大家:
- 错误的研究思路:不少研究者会尝试把个体层面的属性(比如「是否高中毕业」,记为
$s_{ij}$)对其所在群体的聚合属性(比如「该群体的高中毕业率」,记为$\bar{S}_j$)做回归,想以此捕捉同伴效应的影响。 - 作者的关键论断:这种方法完全不成立,因为
$s_{ij}$对$\bar{S}_j$的回归系数恒等于1。 - 背后的逻辑:群体的高中毕业率
$\bar{S}_j$本身就是该群体内所有个体$s_{ij}$的平均值。当你把个体变量对这个群体均值做回归时,得到的系数为1只是数学上的必然结果——这是一个恒等式推导出来的结论,根本无法反映任何真实的同伴互动效应。
补充一句:这也是这本书「Mostly Harmless」风格的体现,直接点破很多看似合理的计量方法里的逻辑漏洞,非常接地气。
内容的提问来源于stack exchange,提问作者leo




