楼主: 吉林小王子
7186 60

学习笔记分享,奖励50论坛币   [推广有奖]

  • 3关注
  • 23粉丝

讲师

40%

还不是VIP/贵宾

-

威望
0
论坛币
64985 个
通用积分
31.1711
学术水平
76 点
热心指数
98 点
信用等级
47 点
经验
13900 点
帖子
350
精华
0
在线时间
578 小时
注册时间
2008-6-3
最后登录
2022-4-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
       亲爱的同学们,大家在写论文的时候,都用到了很多模型,有的模型是我们在教科书上学到的,有的模型是在学术期刊上看到的,有的模型是在外文书籍上看到的,这些模型也许我们一开始不知道他的原理,不知道如何实际运用,但是经过您的一段时间学习,努力,您终于能够将其运用自如了,那么现在就来分享你的这份喜悦吧。
      为了让更多的人更快的获得更新的知识,请您谈谈您运用过的模型,方法,请简单介绍您的方法、模型是如何运用到实际中,当然你可能在操作过程中会运用到许多软件,eviews,sas,s_plus,R,matlab等,希望您能够截图说明步骤。举例说明将给与您20——50个论坛币奖励


引例:
面板数据模型的部分,仅供参考:

数据为我国30个省直辖市的历年多个经济指标的数据
步骤1:建立面板数据的第一步,是判断选用固定影响还是随机影响模型。
下面是程序和结果:
a<-read.csv('C:\\Users\\acer\\Desktop\\paneldata.csv',header=T)
a[1:10,]
attach(a)
library(kinship)
library(survival)
library(splines)
library(nlme)
library(lattice)
library(plm)


form<-lnGDP~lnFDI+lngd+lnjk+lncs+sc+fn+lngx
wi<-plm(form,data=a,model="within")
re<-plm(form,data=a,model="random")
phtest(wi,re)
结果:
> phtest(wi,re)


        Hausman Test


data:  lnGDP ~ lnFDI + lngd + lnjk + lncs + sc + fn + lngx
chisq = 433.8309, df = 7, p-value < 2.2e-16
alternative hypothesis: one model is inconsistent
这个p值很小,说明我们应当建立固定效应模型(fixed-effect panel data model)。



步骤2:我们需要判断是否存在个体(即指不同的省份是否有差异)或时间(即不同的年份是否有差异)上存在效应(即individual effect and time effect)。
程序为:
wi<-plm(form,data=a,model="within")
re<-plm(form,data=a,model="random")
phtest(wi,re)
pooltest(form,data=a,effect="individual",model="within")
结果为:
> phtest(wi,re)


        Hausman Test


data:  lnGDP ~ lnFDI + lngd + lnjk + lncs + sc + fn + lngx
chisq = 433.8309, df = 7, p-value < 2.2e-16
alternative hypothesis: one model is inconsistent
这里用的是Hausman检验,(这个检验很有名,一定在文章中要指出来),这个p值很小,说明不同的省份之间是存在差异的,亦即说明我们不应当仅仅建立一个回归模型,而应当考虑面板数据模型。

再检验不同的年份是否有差异:
> pooltest(form,data=a,effect="time",model="within")
Total Sum of Squares: 223.65
Residual Sum of Squares: 5.5215
Multiple R-Squared: 0.97531
F-statistic: 1585.84 on 281 and 7 DF, p-value: 4.4705e-11
Total Sum of Squares: 258.15
Residual Sum of Squares: 176.55
Multiple R-Squared: 0.3161


        F statistic


data:  lnGDP ~ lnFDI + lngd + lnjk + lncs + sc + fn + lngx
F = -3.3521, df1 = 63, df2 = 218, p-value = p-value = 0.03344
alternative hypothesis: unstability


p值也很小,说明存在时间效应。

因此,我们应当建立双向模型。(two-way model)





步骤3:检验数据中是否存在序列相关。
程序和结果:


> #Wooldridge test for AR(1) Errors in fixed-effect models
> pwartest(form,data=a)
chisq = 160.7113, p-value < 2.2e-16
alternative hypothesis: serial correlation


> #Breusch-Godfrey test
> pbgtest(form,data=a,model="within")
chisq = 110.3584, df = 8, p-value < 2.2e-16
alternative hypothesis: serial correlation in idiosyncratic errors
我们用了两种检验方法—Wooldridge检验和Breusch-Godfrey检验,两者的结果都表明存在序列相关。(因为经济变量常常存在滞后效应)
因此:我们建立动态面板数据模型。


步骤4:建立因变量一阶滞后动态面板数据模型

程序和结果:
> z<-plm(form2,data=a,effect="twoways",model="within")
> summary(z)
Twoways effects Within Model


Call:
plm(formula = lnGDP ~ lag(lnGDP, 1) + lnFDI + lngd + lnjk + lncs +
    sc + fn + lngx, data = a, effect = "twoways", model = "within")


Unbalanced Panel: n=30, T=7-9, N=268


Residuals :
    Min.  1st Qu.   Median  3rd Qu.     Max.
-0.05040 -0.01190 -0.00151  0.01090  0.05160


Coefficients :
                 Estimate  Std. Error t-value  Pr(>|t|)   
lag(lnGDP, 1)  0.85226126  0.02404062 35.4509 < 2.2e-16 ***
lnFDI         -0.00958171  0.00304533 -3.1464  0.001653 **
lngd           0.08300597  0.01092805  7.5957 3.062e-14 ***
lnjk           0.01554135  0.00818296  1.8992  0.057534 .  
lncs          -0.00743742  0.01005511 -0.7397  0.459503   
sc            -0.00187426  0.00079621 -2.3540  0.018573 *  
fn             0.00066339  0.00060187  1.1022  0.270364   
lngx           0.02947792  0.01340732  2.1986  0.027903 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Total Sum of Squares: 0.90123
Residual Sum of Squares: 0.078496
Multiple R-Squared: 0.9129
F-statistic: 290.854 on 222 and 8 DF, p-value: 1.5546e-09
>


上面的这个结果给出了各个协变量的估计值和对应的p值。我们可以看到lncs和 fn明显不显著,可以考虑剔除。
> fixef(z,effect="time")
    1998     1999     2000     2001     2002     2003     2004     2005
7.678966 7.669333 7.851724 7.871667 7.974667 8.114000 8.298333 8.454333
    2006
8.607333
>


这个结果给出了不同年份对于GNP的影响程度的系数估计值。
> fixef(z,effect="individual")
     安徽      北京      福建      甘肃      广东      广西      贵州
0.3159479 0.3296284 0.3360433 0.2690685 0.3918811 0.3251789 0.2636895
     海南      河北      河南    黑龙江      湖北      湖南      吉林
0.2724491 0.3368272 0.3562414 0.2921768 0.3072936 0.3402186 0.2814821
     江苏      江西      辽宁    内蒙古      宁夏      青海      山东
0.3504352 0.3143661 0.3061524 0.3329276 0.2226738 0.2693105 0.3657338
     山西      陕西      上海      四川      天津      新疆      云南
0.3219749 0.2895678 0.3121129 0.3179066 0.2869156 0.2455689 0.2897662
     浙江      重庆
0.3536876 0.2772177




步骤5:建立剔除lncs和 fn后的因变量一阶滞后动态面板数据模型
程序和结果:
> form3<-dynformula(lnGDP~lnFDI+lngd+lnjk+sc+lngx,list(1,0,0,0,0,0))
> z1<-plm(form3,data=a,effect="twoways",model="within")
> summary(z1)
Twoways effects Within Model


Call:
plm(formula = lnGDP ~ lag(lnGDP, 1) + lnFDI + lngd + lnjk + sc +
    lngx, data = a, effect = "twoways", model = "within")


Unbalanced Panel: n=30, T=7-9, N=268


Residuals :
    Min.  1st Qu.   Median  3rd Qu.     Max.
-0.05000 -0.01170 -0.00148  0.01040  0.05270


Coefficients :
                 Estimate  Std. Error t-value  Pr(>|t|)   
lag(lnGDP, 1)  0.85664241  0.02311597 37.0585 < 2.2e-16 ***
lnFDI         -0.01008154  0.00301880 -3.3396  0.000839 ***
lngd           0.07803668  0.01033282  7.5523 4.276e-14 ***
lnjk           0.01493284  0.00808623  1.8467  0.064791 .  
sc            -0.00193102  0.00079113 -2.4408  0.014654 *  
lngx           0.03420814  0.01286767  2.6585  0.007850 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Total Sum of Squares: 0.90123
Residual Sum of Squares: 0.079205
Multiple R-Squared: 0.91211
F-statistic: 387.46 on 224 and 6 DF, p-value: 7.8975e-08
>


从上面可以看出,这个模型在显著性水平为0.07下,各项系数全部显著。
对各个地区(即截据项)进行估计结果为:
> fixef(z1,effect="individual")
     安徽      北京      福建      甘肃      广东      广西      贵州
0.2679218 0.3216359 0.2962178 0.2249348 0.3589294 0.2782205 0.2206860
     海南      河北      河南    黑龙江      湖北      湖南      吉林
0.2378180 0.2901350 0.3078225 0.2628207 0.2653672 0.2935142 0.2534690
     江苏      江西      辽宁    内蒙古      宁夏      青海      山东
0.3118309 0.2716132 0.2792191 0.3020984 0.1935617 0.2401060 0.3226166
     山西      陕西      上海      四川      天津      新疆      云南
0.2825636 0.2467644 0.3067745 0.2716447 0.2700671 0.2132193 0.2444440
     浙江      重庆
0.3097046 0.2382718


下面是对时间因素的估计:
> fixef(z1,effect="time")
    1998     1999     2000     2001     2002     2003     2004     2005
7.678966 7.669333 7.851724 7.871667 7.974667 8.114000 8.298333 8.454333
    2006
8.607333

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:50论坛币 0论坛币 学习笔记 论坛币 习笔记 学习 模型 论坛 matlab 教科书

已有 2 人评分学术水平 热心指数 信用等级 收起 理由
贾多多 + 1 + 1 + 1 精彩帖子
huangliang0828 + 1 + 1 + 1 观点有启发

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

沙发
筱陌。 发表于 2012-3-24 21:33:55 |只看作者 |坛友微信交流群
不懂

使用道具

藤椅
aa4625 发表于 2012-3-24 21:36:46 |只看作者 |坛友微信交流群
看看

使用道具

板凳
徐俐 在职认证  发表于 2012-3-24 21:42:02 |只看作者 |坛友微信交流群

使用道具

报纸
6851934lyy 发表于 2012-3-24 21:49:36 |只看作者 |坛友微信交流群
强列支持~

使用道具

地板
xuewuhenqqqq 发表于 2012-3-25 21:54:44 |只看作者 |坛友微信交流群
支持下,貌似有点麻烦,要是有人弄了,正好学习下。支持楼主,必须滴!

使用道具

7
liouche 在职认证  发表于 2012-3-29 14:09:10 |只看作者 |坛友微信交流群
你的数据都是自己电脑里调用的,别人根本运行不出来,感觉R的话方法太多了,现在会的还是些最最基本的

使用道具

8
liouche 在职认证  发表于 2012-3-29 14:12:36 |只看作者 |坛友微信交流群
要搞起来还真不容易

使用道具

9
shiruyi1988 在职认证  发表于 2012-3-29 14:28:31 |只看作者 |坛友微信交流群
好啊

使用道具

10
shiruyi1988 在职认证  发表于 2012-3-29 14:29:07 |只看作者 |坛友微信交流群
努力学习模型

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 15:00