楼主: wzr_2011
3105 2

[一般统计问题] 自变量有大量零值,其余值在0-1之间时,是否(如何)进行对数变化? [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

讲师

28%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
61.1423
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
11383 点
帖子
202
精华
0
在线时间
422 小时
注册时间
2011-5-11
最后登录
2024-12-18

楼主
wzr_2011 发表于 2021-10-11 23:15:36 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,自变量为家庭某类金融资产占金融资产总额的比重,值介于0-1之间,且大量样本偏向于0。此外,由于大量样本家庭未持有该类资产,因此数据库中显示为缺漏值,我认为该情况下可以将缺漏值的样本家庭的占比视为零。

以上是前提情况,我的问题是:这个自变量若要进行对数变化以使其分布更接近正态分布的话,如何变换?

我自己的思考是,若删去大量零值,那么可以参考此贴中https://bbs.pinggu.org/thread-5050570-1-1.html 黄老师的变换方式,即将变量与(1-变量)的比值进行取对数。但如果为了不删除大量为零的样本,那么又该如何?是否有文献有类似的情况吗?

谢谢大家~
[size=18.899999618530273px]21
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:自变量 pinggu thread 金融资产 READ

沙发
wdlbcj 学生认证  发表于 2021-10-12 12:08:58
1.  这个值为什么要进行对数变化?假设推断中不需要对自变量的分布进行正态化假设
2. 应该不需要删除为0 的样本,到可以将其拆分为两个子样本 来比较一下

藤椅
wzr_2011 发表于 2021-10-12 23:03:05
wdlbcj 发表于 2021-10-12 12:08
1.  这个值为什么要进行对数变化?假设推断中不需要对自变量的分布进行正态化假设
2. 应该不需要删除为0  ...
谢谢您的回复,对于第一点,是我基础不扎实了,习惯性的理解是想要通过对数消除长尾部分的异常值,但是对于您提到的对于假设推断中的要求没有特别仔细的去推敲。
对于第二点,如果将零值单独作为一个子样本回归,那么其意义不就是当这个自变量不存在时候的结果嘛?这种比较一般的意义在哪里呢?
再次感谢您的回复!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-4-14 12:49