楼主: llmahayu
1443 9

[问答] R语言OLS回归问题求助 [推广有奖]

  • 0关注
  • 0粉丝

本科生

77%

还不是VIP/贵宾

-

威望
0
论坛币
6 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
516 点
帖子
39
精华
0
在线时间
144 小时
注册时间
2020-4-29
最后登录
2022-8-1

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一个回归问题,想要求助各位
我想要看下时间和GDP之间的关系,想要预测一下2020-2025的GDP数值。我找了1978-2018年的GDP数据做了一个线性回归公式如下
fitind3<-lm(ind3~year+I(year^2),data=ecodata1)
其中:
ind3:是GDP数据
year:是年份(1978-2018)
回归结果如下
Coefficients:
              Estimate Std. Error t value Pr(>|t|)   
(Intercept)  9.795e+11  4.738e+10   20.67   <2e-16 ***
year        -9.853e+08  4.743e+07  -20.77   <2e-16 ***
I(year^2)    2.478e+05  1.187e+04   20.87   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 9509000 on 38 degrees of freedom
Multiple R-squared:  0.9804,        Adjusted R-squared:  0.9794
F-statistic: 949.6 on 2 and 38 DF,  p-value: < 2.2e-16

这里可以看到时间和GDP还是很显著的,R2也高

问题1:
R返回的fit.value是预测值吗?,但是为什么返回的预测值,和手算的差距很大
手算的公式如下
我数据里第一个数据就的时间1978
9.795e+11+( -9.853e+08*1978)+(2.478e+05*(1978^2))=90135200
但是模型fit.value 第一个值是18578360.1  这里为什么会相差那么大是正常的吗,求大神给我指条路,我还是个新手不胜感激

问题2:就是我想预测GDP 是否建立GDP和时间变量的线性回归的思路是正确的。

以上两个疑问请了解的大佬指点一下,哪怕回答一个问题也好,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:OLS R语言 Intercept GDP数据 inter

沙发
llb_321 在职认证  发表于 2020-7-20 11:23:38 |只看作者 |坛友微信交流群
先说第二个问题。
你做的回归,当作熟悉函数的练习就好了。
回归结果只是过去年份GDP变化的拟合,尽管p值、F检验都显示具有很高的显著性,但这是过拟合,你拿任何年度差异不大的数据结果都会这样。
GDP的影响因素事实上与年份这个变量基本没什么关系,GDP取决于一个统计系统积累的年度投资、进出口、消费等诸多样本数据,如果想研究GDP的影响因素,应该是与这些变量进行回归分析和预测,而不是依据年份。
所以,你说的这个思路,方向不对。
如果你想考察GPD变化的周期性,建议还是进行时间序列分析。

再说第一个问题,你先看看手算的90135200与ecodata1中1978年的样本数据差异大不大。实际上summary(fitind3)应该不会有18578360.1这个结果,而且解一下你的回归方程就可以知道是不可能得到这个数的。
已有 2 人评分论坛币 学术水平 热心指数 收起 理由
cheetahfly + 10 热心帮助其他会员
llmahayu + 1 + 1 精彩帖子

总评分: 论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

藤椅
llmahayu 发表于 2020-7-20 11:57:08 |只看作者 |坛友微信交流群
llb_321 发表于 2020-7-20 11:23
先说第二个问题。
你做的回归,当作熟悉函数的练习就好了。
回归结果只是过去年份GDP变化的拟合,尽管p值 ...
感谢您的回复
其实我一开始也觉得直接用GDP和时间回归会一些奇怪,这里这么做是因为,老师让我用趋势外推法来预测下2021-2025的GDP,我查了下趋势外推,线性回归就一种,如果我建立的是GDP~进出口额的线性回归,如预测2022年的GDP,就需要知道2022年的进出口额,但这个变量的未来也是不知道的,如此才想着用时间拟合试一下,但我觉得你说没错,这里其实任何数字都是显著的。这样做因该是有问题的。

关于第二个问题
手算的和真实数据差别也非常大,fit.value和真实值,和手算值 三个值都有很大差别  
这个方程回归出来
真实值是50000多,手算值是90000多,fit.value18000多相差非常大,我自己也用R的示例数据women看了下身高和体重的方程 手算预测值和预测值差距就0.0几应该是我方程建立思路的问题把。

再次感谢您的回答。

使用道具

板凳
果果莹 发表于 2020-7-22 20:10:56 |只看作者 |坛友微信交流群
llmahayu 发表于 2020-7-20 11:57
感谢您的回复
其实我一开始也觉得直接用GDP和时间回归会一些奇怪,这里这么做是因为,老师让我用趋势外推 ...
GDP和时间做回归,这个都不满足经济显著性,就算你上面做出来在统计上是显著的,也没有意义。从经济上分析GDP和年份之间是没什么关系的。
做预测的话,假设你得到了2019年之前的数据,然后根据数据估计出来GDP的回归方程,就可以利用回归方程得到2020-2025年的GDP的预测值。
预测2022年的GDP,就需要知道2022年的进出口额,但这个变量的未来也是不知道的。——2022年真实GDP确实是不知道的,但你可以知道2022年GDP的预测值。

使用道具

报纸
llmahayu 发表于 2020-7-23 12:48:15 |只看作者 |坛友微信交流群
果果莹 发表于 2020-7-22 20:10
GDP和时间做回归,这个都不满足经济显著性,就算你上面做出来在统计上是显著的,也没有意义。从经济上分析 ...
同样感谢回复
是这样假设我的回归方程是 GDP=进出口额,这个数据是2010-2019年的 那么GDP 和进出口额就是对应的关系了,这个时候我要知道我要得到2020的GDP 就一定要知道2020年的进出口额,这样我还是要预测2020年的进出口,又要用另外一个方法就感觉很麻烦。我已经改用GM 和ARIMA来预测分析了
再次感谢回复

使用道具

地板
wx2123 在职认证  发表于 2020-7-23 23:19:19 |只看作者 |坛友微信交流群
你怎么知道GDP和年份是线性关系。经济都是有周期的,我觉得非线性的可能性更大。可以加入x^2项看看效果。

使用道具

7
llmahayu 发表于 2020-8-12 14:53:42 |只看作者 |坛友微信交流群
wx2123 发表于 2020-7-23 23:19
你怎么知道GDP和年份是线性关系。经济都是有周期的,我觉得非线性的可能性更大。可以加入x^2项看看效果。
已经改用GM(1,1)模型了,是的这里直接时间和GDP回归并不是很好,谢谢回复

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-2 17:12