楼主: athas_pro
13366 16

[回归分析求助] 因变量有大量0值可以考虑tobit,那自变量有大量0值怎么办呢? [推广有奖]

11
黃河泉 在职认证  发表于 2020-3-7 10:24:29 |只看作者 |坛友微信交流群
zxined 发表于 2020-3-6 23:02
老师,请问从理论上来说,为什么这样的分布大概率不会显著呢?
你想一想,若解释变量大多是 0,表示没什么变异,但被解释变量正常是有所变异,你觉得不太变异的解释变量怎么来解释有所变异之被解释变量呢?

使用道具

12
景观之谜 发表于 2020-12-10 10:00:29 |只看作者 |坛友微信交流群
请问题题主解决了吗,结果怎么样?
我也是自变量有很多0值
不理解你第二种方法是什么意思,另外的3000个变量重新生成一个变量吗?

使用道具

13
18756957558 发表于 2021-3-9 21:20:21 |只看作者 |坛友微信交流群
所以可以直接放进去回归是吗

使用道具

14
eton2333 发表于 2022-1-3 23:18:40 |只看作者 |坛友微信交流群
黃河泉 发表于 2020-3-7 10:24
你想一想,若解释变量大多是 0,表示没什么变异,但被解释变量正常是有所变异,你觉得不太变异的解释变量 ...
黄老师,看了您这个解释,觉得有道理。我也遇到了类似的问题,因变量和其他控制变量有193632个,唯独自变量仅为28824个,存在164808个零,非零值占比为14.9%,已有文献没有提及如何处理。原始数据的局限性,若删除会损失75%的样本,想请教您,有什么方法挽救吗?

使用道具

15
欣然cynthia 在职认证  学生认证  发表于 2023-6-17 17:10:38 |只看作者 |坛友微信交流群
eton2333 发表于 2022-1-3 23:18
黄老师,看了您这个解释,觉得有道理。我也遇到了类似的问题,因变量和其他控制变量有193632个,唯独自变 ...
请问如何解决这个问题呢

使用道具

16
吸吸源 发表于 2023-12-5 15:33:45 |只看作者 |坛友微信交流群
您好,我也遇到的同样的问题,一万多个数据中自变量有两千多非0,所以是可以直接跑线性回归么?

使用道具

17
蘑菇也是菜 发表于 2024-3-28 23:56:30 |只看作者 |坛友微信交流群
请问最后怎么解决的?我的数据也是10%不是0值

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 05:11