如题,自变量为家庭某类金融资产占金融资产总额的比重,值介于0-1之间,且大量样本偏向于0。此外,由于大量样本家庭未持有该类资产,因此数据库中显示为缺漏值,我认为该情况下可以将缺漏值的样本家庭的占比视为零。
以上是前提情况,我的问题是:这个自变量若要进行对数变化以使其分布更接近正态分布的话,如何变换?
我自己的思考是,若删去大量零值,那么可以参考此贴中https://bbs.pinggu.org/thread-5050570-1-1.html 黄老师的变换方式,即将变量与(1-变量)的比值进行取对数。但如果为了不删除大量为零的样本,那么又该如何?是否有文献有类似的情况吗?
谢谢大家~
[size=18.899999618530273px]21


雷达卡





京公网安备 11010802022788号







