楼主: delo
26761 35

[其他] 因变量为比值可否取对数 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

5%

还不是VIP/贵宾

-

威望
0
论坛币
67370 个
通用积分
3.8837
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1139 点
帖子
57
精华
0
在线时间
172 小时
注册时间
2006-2-20
最后登录
2024-10-22

楼主
delo 发表于 2015-10-22 20:33:46 |AI写论文
100论坛币
因变量是比率,但标准差较大,即个别样本间相差倍数非常大(例如几千倍),可否取对数?研究只关注核心变量是否对因变量有影响,以及影响的方向,不用于预测,也不是很在意系数大小。或者说,不太需要在意系数的解释意义,而更看重对因变量是否有显著影响。现在的情况是,取对数得到的结果更符合预期;如果不取对数,关键变量可能会出现不显著的情况。
请求解惑,多谢!

最佳答案

犹疑蜀魄千年恨 查看完整内容

可以取对数的,比如金融结构一系列的文章中,都是直接对金融结构取了对数的,事实上也是看这个比例的含义吧,如果A/B的比例大小意味着A和B的相对大小,希望探究解释变量对相对大小的影响,那么可以用log(A/B)。
关键词:取对数 因变量 关键变量 标准差 因变量

沙发
犹疑蜀魄千年恨 发表于 2015-10-22 20:33:47
可以取对数的,比如金融结构一系列的文章中,都是直接对金融结构取了对数的,事实上也是看这个比例的含义吧,如果A/B的比例大小意味着A和B的相对大小,希望探究解释变量对相对大小的影响,那么可以用log(A/B)。

藤椅
星河涌动 发表于 2015-10-23 00:41:11
你的提问包括了2个问题:1、取对数是否对相关性有影响;2、为什么取对数后得到的结果显著性更强。
对第二个问题:取对数可以消除异方差,可能使原本非线性的关系变成线性关系。
参考:http://www.zhihu.com/question/22012482
对第一个问题:取对数肯定是影响了相关性的性质和强弱,但不改变影响方向;弱到一定程度看作没有相关性也可以。
以上拙见仅供参考,算是抛砖引玉吧。
已有 1 人评分论坛币 收起 理由
admin_kefu + 15 热心帮助其他会员

总评分: 论坛币 + 15   查看全部评分

板凳
anecmy 发表于 2015-10-23 02:57:59
The dependent variable can be ratio, interval or logged but you will need careful interpretation of the estimated coefficients.
已有 1 人评分论坛币 收起 理由
admin_kefu + 5 热心帮助其他会员

总评分: 论坛币 + 5   查看全部评分

报纸
delo 发表于 2015-10-23 08:15:53
星河涌动 发表于 2015-10-23 00:41
你的提问包括了2个问题:1、取对数是否对相关性有影响;2、为什么取对数后得到的结果显著性更强。
对第二个 ...
那如果变量是比例,可否取对数呢?谢谢!

地板
xiaopangge 发表于 2015-10-23 08:19:36
你这个因变量是比率,再取对数,就变成了logistic回归模型的问题,你可以看看关于logistic回归模型的知识,而你只关注有莫有显著性检验,你可以做一个假设检验,来验证一下。
已有 1 人评分论坛币 收起 理由
admin_kefu + 5 热心帮助其他会员

总评分: 论坛币 + 5   查看全部评分

7
tonia08 发表于 2015-10-23 10:32:02
When we take the log, we change the units of measurement of the dependent variable. You can do it even the dependent variable if ratio. The spread of the residuals changes systematically with the values of the dependent variable. The purpose of the transformation is to remove that systematic change in spread. Sometime, taking the log can normalize the variable. However, the coefficients of the independent variables will be changed. It depends on whether you take the log on both dependent and independent variables or not. If you take the log on both sides, then the coefficient of x is the elasticity of y respect to x. If you take the log only on dependent variable, then the 100*coefficient of x is the semi-elasticity of y respect to x.
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

8
我若隐若现 学生认证  发表于 2015-10-23 18:24:54
麻烦楼主知道了告知           非常感谢

9
2731599744 发表于 2015-10-23 23:08:07
个人认为应该是取对数的,这样避免了异方差性和测算弹性

10
delo 发表于 2015-10-23 23:14:19
我若隐若现 发表于 2015-10-23 18:24
麻烦楼主知道了告知           非常感谢
我在论坛里搜索得到的答案是说,比例不应该再取对数……虽然往往取了对数后模型结果会更好,但是有人很明确说不能取。不知道有没有内行人可以给出确切答案呢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-31 03:42