楼主: lovebeatles
52229 34

对时间序列取对数,负数怎么处理? [推广有奖]

21
lzhfgood 发表于 2011-3-1 15:35:18
kakamama 发表于 2011-3-1 15:02
lzhfgood 发表于 2011-3-1 14:53
kakamama 发表于 2011-3-1 14:14
lzhfgood 发表于 2011-3-1 13:34
16# kakamama

不明白你的意思。

不过,取对数的目的显然不是这么简单。
不论具体什么目的,总之,同一列数据,有的取对数取成lnx,有的取成-ln(-x),到底该怎么解释?应该对同一列数据进行统一的处理才行呀。
很显然,我说的这种方法是一种尺度缩小的方法。而且我再次强调,这种方法是否合适取决于问题。

问题都没有,你让我如何解释?不存在可以不考虑目的的数据处理方法,也不存在这种准则。所以你所说的“应该”本身就有问题。

例如收益率取对数,很大的一个原因是和正态分布有关,因为对数化才可以满足正态分布的很多性质。

此外,还有出于对平稳性的考虑等。

总之一句话,这取决于你的问题。如果原问题根本用不着取对数,又如何要如此大费周折呢?
现在肯定是需要取对数才取的呀,否则楼主干嘛问这个问题,你不是在侮辱楼主的智商么?
我看楼主恰恰不知道为什么要取对数!再说了,问了这个问题就说明一定要取对数么?

我只是在提醒楼主,如果不给出具体的研究目的,大家很难给一个确切的回答。

我要是花这么多时间只是为了侮辱别人的智商,那只能说明我的智商有问题。

我实在不知道你这么激动是出于什么原因!
大仙

22
kakamama 发表于 2011-3-1 15:58:23
lzhfgood 发表于 2011-3-1 15:35
kakamama 发表于 2011-3-1 15:02
lzhfgood 发表于 2011-3-1 14:53
kakamama 发表于 2011-3-1 14:14
lzhfgood 发表于 2011-3-1 13:34
16# kakamama

不明白你的意思。

不过,取对数的目的显然不是这么简单。
不论具体什么目的,总之,同一列数据,有的取对数取成lnx,有的取成-ln(-x),到底该怎么解释?应该对同一列数据进行统一的处理才行呀。
很显然,我说的这种方法是一种尺度缩小的方法。而且我再次强调,这种方法是否合适取决于问题。

问题都没有,你让我如何解释?不存在可以不考虑目的的数据处理方法,也不存在这种准则。所以你所说的“应该”本身就有问题。

例如收益率取对数,很大的一个原因是和正态分布有关,因为对数化才可以满足正态分布的很多性质。

此外,还有出于对平稳性的考虑等。

总之一句话,这取决于你的问题。如果原问题根本用不着取对数,又如何要如此大费周折呢?
现在肯定是需要取对数才取的呀,否则楼主干嘛问这个问题,你不是在侮辱楼主的智商么?
我看楼主恰恰不知道为什么要取对数!再说了,问了这个问题就说明一定要取对数么?

我只是在提醒楼主,如果不给出具体的研究目的,大家很难给一个确切的回答。

我要是花这么多时间只是为了侮辱别人的智商,那只能说明我的智商有问题。

我实在不知道你这么激动是出于什么原因!
我这么激动是因为你根本也不明白为什么用-ln(-x),然后解释不了,也就不解释了,在这里绕来绕去。你如果声称可以并用lnx和-ln(-x),那么是不是比如一个经常项目盈余的时间序列(10,-9,23,-8,-11,7)在建模的时候就变成了(ln10,-ln9,ln23,-ln8,-ln11,ln7)?你对同一个变量的处理都不统一,哪里还有什么经济意义?比如经常项目盈余对GDP的简单回归,GDP肯定是正数,而经常项目盈余的时间序列,你已经看到了,是有正有负的,这个时候你怎么处理?

23
lzhfgood 发表于 2011-3-1 16:54:11
kakamama 发表于 2011-3-1 15:58
lzhfgood 发表于 2011-3-1 15:35
kakamama 发表于 2011-3-1 15:02
lzhfgood 发表于 2011-3-1 14:53
kakamama 发表于 2011-3-1 14:14
lzhfgood 发表于 2011-3-1 13:34
16# kakamama

不明白你的意思。

不过,取对数的目的显然不是这么简单。
不论具体什么目的,总之,同一列数据,有的取对数取成lnx,有的取成-ln(-x),到底该怎么解释?应该对同一列数据进行统一的处理才行呀。
很显然,我说的这种方法是一种尺度缩小的方法。而且我再次强调,这种方法是否合适取决于问题。

问题都没有,你让我如何解释?不存在可以不考虑目的的数据处理方法,也不存在这种准则。所以你所说的“应该”本身就有问题。

例如收益率取对数,很大的一个原因是和正态分布有关,因为对数化才可以满足正态分布的很多性质。

此外,还有出于对平稳性的考虑等。

总之一句话,这取决于你的问题。如果原问题根本用不着取对数,又如何要如此大费周折呢?
现在肯定是需要取对数才取的呀,否则楼主干嘛问这个问题,你不是在侮辱楼主的智商么?
我看楼主恰恰不知道为什么要取对数!再说了,问了这个问题就说明一定要取对数么?

我只是在提醒楼主,如果不给出具体的研究目的,大家很难给一个确切的回答。

我要是花这么多时间只是为了侮辱别人的智商,那只能说明我的智商有问题。

我实在不知道你这么激动是出于什么原因!
我这么激动是因为你根本也不明白为什么用-ln(-x),然后解释不了,也就不解释了,在这里绕来绕去。你如果声称可以并用lnx和-ln(-x),那么是不是比如一个经常项目盈余的时间序列(10,-9,23,-8,-11,7)在建模的时候就变成了(ln10,-ln9,ln23,-ln8,-ln11,ln7)?你对同一个变量的处理都不统一,哪里还有什么经济意义?比如经常项目盈余对GDP的简单回归,GDP肯定是正数,而经常项目盈余的时间序列,你已经看到了,是有正有负的,这个时候你怎么处理?
很好,你这里终于给定了一个明确的问题。

设定经常项目盈余为x,GDP为y,请问你要设定的模型是什么?你这里的简单回归是什么意思?y=a+bx+e?如果直观上两者真是这样呈现出线性关系,那根本就没有取对数的必要。

如果不是线性关系,那么这样得到的e可能是非平稳的,从而产生伪回归的问题。如果直观上y对x的变化是指数式的,即x线性增长,而y增速相对放慢,那么直观上两者是指数式关系。值得一提的是,此时只需对GDP取对数,没有必要对经常项目余额取对数。

只有当两者都对数化后直观上呈现线性关系,你才能做简单线性回归。

这里,对经常项目盈余的对数化可以采取我先前所说的形式,也可以按照前面一些人的说法,先加一个合适的正数。但无论如何,这取决于两者数量关系的本质是怎样的。

经济意义很简单,对单独的序列而言,这就是一个纯粹的尺度变小。从模型上来讲,要解决的是伪回归的问题。

对同一变量处理不统一就没有经济意义了?那ln(GDP)又是什么东西?

最后需要说明的是,对于经常项目盈余和GDP的关系建模问题,我并不熟悉。但是如果事先设定要做简单的线性回归,那以上分析可以作为我进行数据变换的理由。
大仙

24
kakamama 发表于 2011-3-1 20:54:53
lzhfgood 发表于 2011-3-1 16:54
kakamama 发表于 2011-3-1 15:58
lzhfgood 发表于 2011-3-1 15:35
kakamama 发表于 2011-3-1 15:02
lzhfgood 发表于 2011-3-1 14:53
kakamama 发表于 2011-3-1 14:14
lzhfgood 发表于 2011-3-1 13:34
16# kakamama

不明白你的意思。

不过,取对数的目的显然不是这么简单。
不论具体什么目的,总之,同一列数据,有的取对数取成lnx,有的取成-ln(-x),到底该怎么解释?应该对同一列数据进行统一的处理才行呀。
很显然,我说的这种方法是一种尺度缩小的方法。而且我再次强调,这种方法是否合适取决于问题。

问题都没有,你让我如何解释?不存在可以不考虑目的的数据处理方法,也不存在这种准则。所以你所说的“应该”本身就有问题。

例如收益率取对数,很大的一个原因是和正态分布有关,因为对数化才可以满足正态分布的很多性质。

此外,还有出于对平稳性的考虑等。

总之一句话,这取决于你的问题。如果原问题根本用不着取对数,又如何要如此大费周折呢?
现在肯定是需要取对数才取的呀,否则楼主干嘛问这个问题,你不是在侮辱楼主的智商么?
我看楼主恰恰不知道为什么要取对数!再说了,问了这个问题就说明一定要取对数么?

我只是在提醒楼主,如果不给出具体的研究目的,大家很难给一个确切的回答。

我要是花这么多时间只是为了侮辱别人的智商,那只能说明我的智商有问题。

我实在不知道你这么激动是出于什么原因!
我这么激动是因为你根本也不明白为什么用-ln(-x),然后解释不了,也就不解释了,在这里绕来绕去。你如果声称可以并用lnx和-ln(-x),那么是不是比如一个经常项目盈余的时间序列(10,-9,23,-8,-11,7)在建模的时候就变成了(ln10,-ln9,ln23,-ln8,-ln11,ln7)?你对同一个变量的处理都不统一,哪里还有什么经济意义?比如经常项目盈余对GDP的简单回归,GDP肯定是正数,而经常项目盈余的时间序列,你已经看到了,是有正有负的,这个时候你怎么处理?
很好,你这里终于给定了一个明确的问题。

设定经常项目盈余为x,GDP为y,请问你要设定的模型是什么?你这里的简单回归是什么意思?y=a+bx+e?如果直观上两者真是这样呈现出线性关系,那根本就没有取对数的必要。

如果不是线性关系,那么这样得到的e可能是非平稳的,从而产生伪回归的问题。如果直观上y对x的变化是指数式的,即x线性增长,而y增速相对放慢,那么直观上两者是指数式关系。值得一提的是,此时只需对GDP取对数,没有必要对经常项目余额取对数。

只有当两者都对数化后直观上呈现线性关系,你才能做简单线性回归。

这里,对经常项目盈余的对数化可以采取我先前所说的形式,也可以按照前面一些人的说法,先加一个合适的正数。但无论如何,这取决于两者数量关系的本质是怎样的。

经济意义很简单,对单独的序列而言,这就是一个纯粹的尺度变小。从模型上来讲,要解决的是伪回归的问题。

对同一变量处理不统一就没有经济意义了?那ln(GDP)又是什么东西?

最后需要说明的是,对于经常项目盈余和GDP的关系建模问题,我并不熟悉。但是如果事先设定要做简单的线性回归,那以上分析可以作为我进行数据变换的理由。
没有印象了,前面谁提了先加一个合适的正数了?其实我要的就是一个对同一变量做统一处理的方法,作为解决有负数的log回归的一种一般性的尝试。至于为什么用log,那是因为logy=a+b*logx的公式近似的等价于dy/y=a1+b1*dx/x。这才是大家一般为什么用log的原因。

25
lzhfgood 发表于 2011-3-1 21:45:50
24# kakamama

“那是因为logy=a+b*logx的公式近似的等价于dy/y=a1+b1*dx/x。这才是大家一般为什么用log的原因。”

dlogy才近似等价于dy/y,你这里指的一般设计收益率的问题,而直接假设收益率服从正态分布会存在一系列问题,取对数则有效的解决了这个问题。很多时候取对数只是为了解决伪回归的问题,并不像你所说的那样。

你如此执着统一的数据处理方式令我很无奈,我只想说,如果你理解了什么是伪回归,原则上你可以采取任何的数据处理方式,只要你能解释。我这里的解释就是尺度变换。如果你实在无法理解,那你按照我的方法将变换前后的数据做成散点图一对比就知道了。当然,我并不确保我这种方法的绝对正确性,我只是一再强调我这种方法有它的道理。
大仙

26
kakamama 发表于 2011-3-1 22:33:02
lzhfgood 发表于 2011-3-1 21:45
24# kakamama

“那是因为logy=a+b*logx的公式近似的等价于dy/y=a1+b1*dx/x。这才是大家一般为什么用log的原因。”

dlogy才近似等价于dy/y,你这里指的一般设计收益率的问题,而直接假设收益率服从正态分布会存在一系列问题,取对数则有效的解决了这个问题。很多时候取对数只是为了解决伪回归的问题,并不像你所说的那样。

你如此执着统一的数据处理方式令我很无奈,我只想说,如果你理解了什么是伪回归,原则上你可以采取任何的数据处理方式,只要你能解释。我这里的解释就是尺度变换。如果你实在无法理解,那你按照我的方法将变换前后的数据做成散点图一对比就知道了。当然,我并不确保我这种方法的绝对正确性,我只是一再强调我这种方法有它的道理。
好吧,我试试。

27
laskiwallace 发表于 2011-3-2 17:51:49
该问题已经解决,见此帖的方法:
http://www.pinggu.org/BBS/viewthread.php?tid=1040157&page=1&extra=#pid8505360

28
michaeljija 发表于 2011-3-2 18:25:30
If the r is very small,
You can take log(1+r).

29
lucialiu 发表于 2012-4-3 00:05:29

30
★燕儿飞☆ 发表于 2013-4-10 15:23:58
如果数据中对部分数据进行取对数处理,对其他一些数据不进行对数处理(这些数据本身比较小,没有取对数的必要),可以继续进行下面的数据分析吗?还是要所有的数据进行同样的处理才可以。?????

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-25 13:33