对存在大量零值的变量取对数
原始数据为x,但x有大量的零值。
要将x转化为对数形式,即建立新变量y.
采用y=log(x+1)的形式是否合理?
但其可能改变统计分布,如数据中报告的均为级别(x,y,z,t组)变量的均值,为何在rd中,样本组y的均值小于样本组x,而在lrd中,样本组y的均值大于样本组x?
变量 | rd | Lrd |
X | 273.3 | 0.501 |
Y | 181.3 | 0.559 |
Z | 204.1 | 0.508 |
T | 217.9 | 0.424 |
|
楼主: peyzf
|
5202
2
[Stata高级班] 对存在大量零值的变量取对数出现的问题 |
|
大师 59%
-
|
| |||||||||||||||||
|
|
| ||
| ||
加好友,备注jltj京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


