1.在处理边界值时,可以采用两种方法:winsor及drop? 通常这两种方法如何选择?
A: 各有优劣。drop 相对而言比较干净,但会损失很多观察值;而 winsor 则不会损失观察值。就我所在的公司财务领域而言,基本上都在使用 winsor。你可以查看一下 JF 或 JFE 上的文章。
2.处理分位点的选择:通常采用99分位还95分位?
A: 一般是 99th。对于极个别离群值很严重的变量,如果需要特殊处理,需要在文中说明。参见如下两篇文章(前者是标准的 99th winsor,后者则是个别处理,p.678):
Flannery, M. J., K. P. Rangan, 2006, “Partial adjustment toward target capital structures”, Journal of Financial Economics, 79 (3), pp. 469-506.
Cleary, S., 1999, “The Relationship between Firm Investment and Financial Status”, Journal of Finance, 54 (2), pp. 673-692.
3.假如使用drop,其是需要对每一个关键变量的边界值进行,还是只需要取几个最核心的?drop各个变量的边界值时,变量如何排序,即先drop哪个变量的边界值?其可能会显著影响最终结果。
A: 使用 drop 主要是针对那些明显不合理的观察值,如总资产小于零,或销售额小于零的观察值。至于你提及的后续几个问题,我没有考虑过,也不知是否需要这么细致的处理。
参见下文 pp.677:
Cleary, S., 1999, “The Relationship between Firm Investment and Financial Status”, Journal of Finance, 54 (2), pp. 673-692.
4.对比没有经过边界值与经过边界处理的回归结果,如果发生了很大的变化,其是否意味着必须进行drop或winsor处理?
A: 是的。
|