楼主: kiddy_q
8674 53

[经济] 关于相关性分析,急!!!! [推广有奖]

21
yongliluo728 发表于 2010-7-24 00:58:22
kiddy_q 发表于 2010-7-23 21:07
4# feig
请问大样本一般是多少数据量?
一般而言,样本数至少应该是解释变量的5-10倍,否则损失自由度,利用最小二乘法得出来的r平方是没有意义的。

建议要么增加样本数,要么删除几个解释变量, 只保留2-3个解释变量。

22
yuanjackson 发表于 2010-7-24 08:41:08
上面只有robinlyf说的对路。
不过楼主的这个问题跟跟样本量大小不是很相关,在样本量大的情况下也是经常会出现的。
楼主遇到困难主要是存在着两个基本的误区。
首先是相关系数与回归结果中的估计量和统计量间的差别。相关系数只是描述两个序列趋势或者数据分布间的相关程度。而p-value或者t-statistic通常只是检验数据是否显著(区别于0)。你的结果其实并没有体现出item1与item5有较强的相关性,item5的系数所伴随的较高的t-statistic或者较低的p-value只说明你的所得到的系数的估计值0.0023是显著的。记住,p-value体现了系数估计值的显著程度,而不体现相关程度。
我想说的第二点是,相关系数仅仅体现了两个序列间的关系,而回归分析体现的是一系列变量间的关系。item1中可能会与item2部分相关的同时与item3部分相关,但item3与item2间也会有部分相关,而这些部分中经常会有重叠,所以当你用item2和item3同时作为item1的解释变量进行回归的时候,他们各自的系数都会略小些也是正常的,除非你item2与item3是完全不相关的。
这些都是很基本的统计和计量知识。如果真的搞这方面的工作,还是补补为好。
前面一些人提到了样本量,这当然也是个问题。但我觉得这还不是你的焦点。

23
beijin2008 发表于 2010-7-24 09:45:56
yuanjackson 发表于 2010-7-24 08:41
上面只有robinlyf说的对路。
不过楼主的这个问题跟跟样本量大小不是很相关,在样本量大的情况下也是经常会出现的。
楼主遇到困难主要是存在着两个基本的误区。
首先是相关系数与回归结果中的估计量和统计量间的差别。相关系数只是描述两个序列趋势或者数据分布间的相关程度。而p-value或者t-statistic通常只是检验数据是否显著(区别于0)。你的结果其实并没有体现出item1与item5有较强的相关性,item5的系数所伴随的较高的t-statistic或者较低的p-value只说明你的所得到的系数的估计值0.0023是显著的。记住,p-value体现了系数估计值的显著程度,而不体现相关程度。
我想说的第二点是,相关系数仅仅体现了两个序列间的关系,而回归分析体现的是一系列变量间的关系。item1中可能会与item2部分相关的同时与item3部分相关,但item3与item2间也会有部分相关,而这些部分中经常会有重叠,所以当你用item2和item3同时作为item1的解释变量进行回归的时候,他们各自的系数都会略小些也是正常的,除非你item2与item3是完全不相关的。
这些都是很基本的统计和计量知识。如果真的搞这方面的工作,还是补补为好。
前面一些人提到了样本量,这当然也是个问题。但我觉得这还不是你的焦点。
说得真好,希望楼主增加样本,好好研究一下统计
蓝天白云

24
lewst 在职认证  发表于 2010-7-24 09:49:39
样本点太少了

25
张呼呼老师 发表于 2010-7-24 10:05:19
打好基础!搞清楚回归p值和相关系数的概念

26
重读柏格森 发表于 2010-7-24 10:10:57
样本数量太少,而且这五个变量之间的关系要深入分析。
柏格森非理性主义

27
mxd1118 发表于 2010-7-24 11:01:44
相关系数表示两个变量之间线性相关程度和方向的度量指标,其值介于-1—1之间,绝对值越大相关程度越高。
回归P值可以理解为在总体回归系数为0的原假设条件下得到样本统计量出现的概率,其值在0—1之间,越小(一般小于0.5)就表示越能拒绝原假设,说明总体回归系数是显著的(自变量的变化能引起因变量的变化),即回归系数通过显著性检验。
学习学习再学习!

28
szxship 发表于 2010-7-24 11:07:52
因为,你在回归分析的时候,item3,item4, item5,item6 之间的相关关系产生了抵消作用,所以出现这个问题,
这叫做多重共线性!你查看一些统计上的书会有这个分析的!

29
crackman 发表于 2010-7-24 11:08:55
你做回归
研究相关
15个绝对是做不出来的
至少是你研究变量数的20倍

30
lukeli258 发表于 2010-7-24 11:41:29
至少需要60多个样本,即测度变量的10倍

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 04:08