一个回归问题,想要求助各位
我想要看下时间和GDP之间的关系,想要预测一下2020-2025的GDP数值。我找了1978-2018年的GDP数据做了一个线性回归公式如下
fitind3<-lm(ind3~year+I(year^2),data=ecodata1)
其中:
ind3:是GDP数据
year:是年份(1978-2018)
回归结果如下
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.795e+11 4.738e+10 20.67 <2e-16 ***
year -9.853e+08 4.743e+07 -20.77 <2e-16 ***
I(year^2) 2.478e+05 1.187e+04 20.87 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 9509000 on 38 degrees of freedom
Multiple R-squared: 0.9804, Adjusted R-squared: 0.9794
F-statistic: 949.6 on 2 and 38 DF, p-value: < 2.2e-16
这里可以看到时间和GDP还是很显著的,R2也高
问题1:
R返回的fit.value是预测值吗?,但是为什么返回的预测值,和手算的差距很大
手算的公式如下
我数据里第一个数据就的时间1978
9.795e+11+( -9.853e+08*1978)+(2.478e+05*(1978^2))=90135200
但是模型fit.value 第一个值是18578360.1 这里为什么会相差那么大是正常的吗,求大神给我指条路,我还是个新手不胜感激
问题2:就是我想预测GDP 是否建立GDP和时间变量的线性回归的思路是正确的。
以上两个疑问请了解的大佬指点一下,哪怕回答一个问题也好,谢谢