你遇到的这个问题我也遇到过,但研究的不是同一个领域问题,却方法上非常类似。由于你提供的文献研究的是高管薪酬水平,就可能有高于理想值(拟合值或者预测值)和低于理想值(拟合值或者预测值)的情况。如果研究高管收入高于理想值按道理应该删除那些低于理想值(拟合值或者预测值)的数据。通常对整个样本(不但关注高于理想值,还低于理想值),这时有学者提出了先做正常值(实际值)与预测值(拟合值)之差的绝对值,然后将其与模型的均方误根(RMSE)进行比较。如果绝对值小于RMSE,则认为正常,因为模型一般来说不能完全拟合现实,会存在干扰等因素。如果绝对值大于RMSE,则认为超过了正常收益值。你提供的文献上很可能对方选择的样本均是超过正常收益(超过平均或0.9分位数收益)的样本,因而不存在负数的情况,因而你需要对所有的样本和观测值进行观察后筛选下。如果要研究低于实际值的情况,还有一种做法是统一加一个常数(比如1),然后再计算,以上只是我个人研究领域的一些做法,看到你的问题与我的类似,虽然问题和研究主题不同,但很具有类似性,个人看法,仅供参考!
|