快捷搜索:

数据前期清洗过程过长,怎么办?

 

今天我们来做一个多时点DID相关论文可去知网搜索。数据前期清洗过程过长,甚至直接从实证部分开始。

·先来做描述性与相关性检验。这里可以看到政策变量did与被解释变量相关系数显著为正,记住仅仅只是初步判定。下面开始做回归。

·这里主回归同时控制个体时间、行业以及省份固定效应。另外也做了不同组合的固定效率,多维固定。用到reach非命令。具体到实际操作中,大家可以根据自己数据实际进行控制,也可以加多维固定放在文件性检验。就这样不同组合控制固丁萧颖。

·最后把结果导出来,当然导出命令有很多,我这里用的。可能有小伙伴会问为什么回归命令加了keep,这里简单对比一下,加不加keep的结果,结果没任何差别的可以关注到不加keep的。

·下面有一行DRS则是散出了四百三九个样本。回归样本不一致是因为数据是非平衡面板,有些数据只有一年数据,所以只这里做了删除。

·按客户要求,这里做了部分一致性检测。这里做布衣显示操作方法,大致于前面一致。这里按照不同标准做了三组一直性检验。

·下面重点来了,平行趋势与安危机检验。前期的数据处理已经完成,主要是生成各个体的政策时间点以及时间虚拟变量。这里以政策实施后一年为基础,当然可以把十四前一年作为机器。可以看到政策十四前pre变量几乎都不知道,而政策十四后的变量在第二期开始全都显示,这基本符合平行趋势的要求。

·除了显示刚刚的回归结果,可以走平行趋势图。从图中比较直观看到结果。

·下面再来看安危及检验,安危及检验的方式比较多,可以构造虚拟政策实施期,也可以观察静态分布图。这里来讲后者由于数据量很大,这里极其花有时间,我是放在这走睡觉去了第二天看的结果。终于结果出来了。可以看到点呈现正太分布,点均落在0附近。这样一个基本完整的实证就做完了。

同时整理好数据代码就发给客户学习了。

[注:本文部分图片来自互联网!未经授权,不得转载!每天跟着我们读更多的书]


互推传媒文章转载自第三方或本站原创生产,如需转载,请联系版权方授权,如有内容如侵犯了你的权益,请联系我们进行删除!

如若转载,请注明出处:http://www.hfwlcm.com/info/204296.html