楼主: sysuwu000
8516 14

[面板数据求助] 求问Stata中面板数据如何每3个观测值求平均后仅保留1个观测值 [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

博士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
541 个
通用积分
0.1445
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
537 点
帖子
29
精华
0
在线时间
424 小时
注册时间
2012-4-6
最后登录
2025-4-9

楼主
sysuwu000 发表于 2017-8-9 10:43:13 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
非平衡面板数据中,如何对每组(id)某个变量(x)每三个观测值求平均,得到一个样本点后生成新变量(x_new)?也即:每个id下x的第1, 2, 3, 4, 5, 6, 7, 8, 9……等个样本点中,取其第1-3个观测值的平均值作为新变量x_new的第1个样本点;第4-6个观测值的平均值作为新变量x_new的第2个样本点;第7-9个观测值的平均值作为新变量x_new的第3个样本点,依次类推。类似于移动平均(求得1-3,2-4,3-5,4-6,5-7,7-9的移动平均值,但仅保留1-3、4-6、7-9的样本点)。
因为是非平衡面板数据,每个id的起始时间和结束时间都有差异,编程似乎并不可行。求各位大神解答,谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 面板数据 tata 观测值 求平均

回帖推荐

黃河泉 发表于10楼  查看完整内容

1. 你讲的情况我遇过,只是前面的叙述并不精确!2. 请 search paverage 并安装 paverage 与 help paverage。3. 我假设你的资料都是从 1961-2016,共 56 年。由于年数必须是 3 的倍数(你的要求),所以你可选择去除最前两年或最后两年然后

沙发
黃河泉 在职认证  发表于 2017-8-9 10:46:29
这应该是可以做的!请用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。

藤椅
sysuwu000 发表于 2017-8-9 11:13:47
黃河泉 发表于 2017-8-9 10:46
这应该是可以做的!请用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一 ...
谢谢老师,我去学习一下这个命令,看是否可行

板凳
黃河泉 在职认证  发表于 2017-8-9 11:16:51
sysuwu000 发表于 2017-8-9 11:13
谢谢老师,我去学习一下这个命令,看是否可行
不是可不可行,是请你将部分资料印出来以供试验!

报纸
sysuwu000 发表于 2017-8-9 11:43:38
黃河泉 发表于 2017-8-9 11:16
不是可不可行,是请你将部分资料印出来以供试验!
数据序列.png 不好意思,老师,刚刚误解了您的意思。图片即为部分数据节选,其中dcp_gr为原始序列,dcp_ma为对dcp_gr取三年移动平均后的序列,但我的目的是每三年保留一个样本点,以Afghanistan为例,保留dcp_ma序列下的1963年、1966年、1969年……的样本点;对应地,Albania保留1997年、2000年……的样本点。不知我是否表达清楚我的想法,如果有便捷的命令,烦请老师指导

地板
黃河泉 在职认证  发表于 2017-8-9 15:13:29
sysuwu000 发表于 2017-8-9 11:43
不好意思,老师,刚刚误解了您的意思。图片即为部分数据节选,其中dcp_gr为原始序列,dcp_ma为对dcp_gr取 ...
请用 dataex 将资料印出,你用图片我还是无法拿到资料!

7
黃河泉 在职认证  发表于 2017-8-9 15:13:44
sysuwu000 发表于 2017-8-9 11:43
不好意思,老师,刚刚误解了您的意思。图片即为部分数据节选,其中dcp_gr为原始序列,dcp_ma为对dcp_gr取 ...
请用 dataex 将资料印出,你用图片我还是无法拿到资料!

8
黃河泉 在职认证  发表于 2017-8-9 15:16:59
sysuwu000 发表于 2017-8-9 11:43
不好意思,老师,刚刚误解了您的意思。图片即为部分数据节选,其中dcp_gr为原始序列,dcp_ma为对dcp_gr取 ...
此外,从没看过有人会平均不同三年的资料(例如第一个国家为 1995-1997;而第二个国家为 1996-1998 之类的)!你确定你知道在做什么吗?

9
sysuwu000 发表于 2017-8-9 16:11:52
黃河泉 发表于 2017-8-9 15:16
此外,从没看过有人会平均不同三年的资料(例如第一个国家为 1995-1997;而第二个国家为 1996-1998 之类的 ...
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str52 countryname float(year dcp_gr dcp_ma)
  4. "United Kingdom" 1961   7.100332          .
  5. "United Kingdom" 1962  4.1795287          .
  6. "United Kingdom" 1963  18.181818    9.82056
  7. "United Kingdom" 1964  16.555183  12.972177
  8. "United Kingdom" 1965   7.604255  14.113752
  9. "United Kingdom" 1966   .8000434   8.319827
  10. "United Kingdom" 1967   5.935447   4.779915
  11. "United Kingdom" 1968  -5.281857   .4845444
  12. "United Kingdom" 1969   6.101546  2.2517118
  13. "United Kingdom" 1970  14.900305   5.239998
  14. "United Kingdom" 1971  18.705091  13.235647
  15. "United Kingdom" 1972    57.8742  30.493196
  16. "United Kingdom" 1973  33.175167  36.584816
  17. "United Kingdom" 1974  12.273762   34.44104
  18. "United Kingdom" 1975  -5.658588  13.263447
  19. "United Kingdom" 1976    -7.0174 -.13407564
  20. "United Kingdom" 1977   7.812089    -1.6213
  21. "United Kingdom" 1978  25.302464   8.699051
  22. "United Kingdom" 1979  32.040905  21.718487
  23. "United Kingdom" 1980  30.452675   29.26535
  24. "United Kingdom" 1981  12.676796   25.05679
  25. "United Kingdom" 1982   5.084925  16.071465
  26. "United Kingdom" 1983   3.504591    7.08877
  27. "United Kingdom" 1984   7.382055   5.323857
  28. "United Kingdom" 1985   10.21716   7.034602
  29. "United Kingdom" 1986   117.2875   44.96224
  30. "United Kingdom" 1987   32.13163    53.2121
  31. "United Kingdom" 1988   35.12926   61.51613
  32. "United Kingdom" 1989  14.469253   27.24338
  33. "United Kingdom" 1990  20.089676  23.229397
  34. "United Kingdom" 1991  2.0740898  12.211006
  35. "United Kingdom" 1992   2.563938   8.242568
  36. "United Kingdom" 1993 -11.620153 -2.3273752
  37. "United Kingdom" 1994   7.618856  -.4791199
  38. "United Kingdom" 1995  14.687862  3.5621884
  39. "United Kingdom" 1996  8.7281685  10.344962
  40. "United Kingdom" 1997   11.98119  11.799073
  41. "United Kingdom" 1998   6.423661    9.04434
  42. "United Kingdom" 1999   4.992479    7.79911
  43. "United Kingdom" 2000   7.332052   6.249397
  44. "United Kingdom" 2001   3.448168   5.257566
  45. "United Kingdom" 2002  12.821027   7.867082
  46. "United Kingdom" 2003   19.44674  11.905312
  47. "United Kingdom" 2004   24.67691   18.98156
  48. "United Kingdom" 2005   9.612027  17.911894
  49. "United Kingdom" 2006  14.667108  16.318682
  50. "United Kingdom" 2007  26.147116   16.80875
  51. "United Kingdom" 2008   6.367045   15.72709
  52. "United Kingdom" 2009 -17.089432   5.141576
  53. "United Kingdom" 2010 -1.1878092  -3.970065
  54. "United Kingdom" 2011 -1.0867847  -6.454675
  55. "United Kingdom" 2012  -4.107019 -2.1272044
  56. "United Kingdom" 2013  -4.298425  -3.164076
  57. "United Kingdom" 2014 -.28148594 -2.8956435
  58. "United Kingdom" 2015  -7.737902  -4.105938
  59. "United Kingdom" 2016    -7.1188  -5.046063
  60. "United States"  1961   9.833033          .
  61. "United States"  1962   8.094186          .
  62. "United States"  1963  12.162332   10.02985
  63. "United States"  1964  11.200723  10.485746
  64. "United States"  1965   12.34816  11.903738
  65. "United States"  1966   6.240107   9.929664
  66. "United States"  1967   10.17695   9.588406
  67. "United States"  1968  10.422895  8.9466505
  68. "United States"  1969   6.868241   9.156029
  69. "United States"  1970   6.348212   7.879783
  70. "United States"  1971  12.788532   8.668328
  71. "United States"  1972  15.442173  11.526306
  72. "United States"  1973  10.327005   12.85257
  73. "United States"  1974   5.492369  10.420516
  74. "United States"  1975   6.896732   7.572035
  75. "United States"  1976   10.46332   7.617474
  76. "United States"  1977  11.485313   9.615122
  77. "United States"  1978  14.780813   12.24315
  78. "United States"  1979  13.327798  13.197975
  79. "United States"  1980  10.402485  12.837032
  80. "United States"  1981    6.15317   9.961151
  81. "United States"  1982   8.204677   8.253444
  82. "United States"  1983  12.785738   9.047861
  83. "United States"  1984   11.89918    10.9632
  84. "United States"  1985  15.111683  13.265533
  85. "United States"  1986  12.139898  13.050254
  86. "United States"  1987   8.382454  11.878012
  87. "United States"  1988   8.878223   9.800192
  88. "United States"  1989  11.384407   9.548362
  89. "United States"  1990  3.2283084   7.830313
  90. "United States"  1991   7.215764    7.27616
  91. "United States"  1992   5.051441   5.165171
  92. "United States"  1993   7.634934   6.634047
  93. "United States"  1994   5.537687   6.074687
  94. "United States"  1995  13.547872   8.906831
  95. "United States"  1996   11.75885   10.28147
  96. "United States"  1997  13.128145  12.811623
  97. "United States"  1998  13.748377  12.878458
  98. "United States"  1999   15.57109  14.149203
  99. "United States"  2000   .8573115  10.058926
  100. "United States"  2001   8.452038   8.293479
  101. "United States"  2002 -1.8242096  2.4950466
  102. "United States"  2003  14.504695   7.044174
  103. "United States"  2004  11.091386   7.923957
  104. end
复制代码
老师,以上是部分原始数据,我的样本是全球样本,原始数据为非平衡面板数据,目的是将样本划分为N个3-year periods,每个period为一个样本点,将N个periods合并成新的panel data set。这种处理方法在全球样本研究中已有先例,可能我之前未交代清楚,不好意思。

10
黃河泉 在职认证  发表于 2017-8-9 16:57:16
sysuwu000 发表于 2017-8-9 16:11
老师,以上是部分原始数据,我的样本是全球样本,原始数据为非平衡面板数据,目的是将样本划分为N个3-yea ...
1. 你讲的情况我遇过,只是前面的叙述并不精确!2. 请 search paverage 并安装 paverage 与 help paverage。3. 我假设你的资料都是从 1961-2016,共 56 年。由于年数必须是 3 的倍数(你的要求),所以你可选择去除最前两年或最后两年
  1. drop if year == 1961 | year == 1962
复制代码
然后
  1. paverage dcp_gr, p(3) indiv(countryname) yr(year)
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 08:50