楼主: 忧壑空谷兰
3612 7

[数据管理求助] 如何生成新观测值,其各变量等于原来部分观测值之和? [推广有奖]

  • 6关注
  • 2粉丝

教授

82%

还不是VIP/贵宾

-

威望
0
论坛币
6278 个
通用积分
274.0801
学术水平
11 点
热心指数
20 点
信用等级
9 点
经验
7089 点
帖子
96
精华
0
在线时间
3261 小时
注册时间
2015-3-19
最后登录
2024-4-17

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位老师同学大家好!如何生成新观测值,其各变量等于原来部分观测值各自变量之和?比如样本有北京、天津、河北,我想得到京津冀总体作为一个样本,每个变量等于其中三个样本各自变量的和,应该怎么做?具体来讲如下:
        地区         变量1            变量2            变量3
        北京          1000             1200             2000
        天津           800              1800             400
        河北          2300             1230             2310
      京津冀           ?                 ?                 ?

    希望可以给予解答,谢谢大家!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:观测值 自变量 京津冀 大家好 怎么做

沙发
黃河泉 在职认证  发表于 2018-7-16 10:41:51 |只看作者 |坛友微信交流群
你若要问程序,永远附上资料;若要附上资料,永远用 dataex 印出资料;先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html

使用道具

藤椅
忧壑空谷兰 发表于 2018-7-16 11:18:11 |只看作者 |坛友微信交流群
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str24 province int year long road double rail
  4. "北京市" 1999  12825   1141.1
  5. "北京市" 2000  13597   1140.9
  6. "北京市" 2001  13891   1160.6
  7. "北京市" 2002  14359   1138.1
  8. "北京市" 2003  14453   1136.1
  9. "北京市" 2004  14630   1124.6
  10. "北京市" 2005  14696   1125.4
  11. "北京市" 2006  20503   1121.5
  12. "北京市" 2007  20754   1119.9
  13. "北京市" 2008  20340   1166.5
  14. "北京市" 2009  20755 1169.459
  15. "北京市" 2010  21114   1169.4
  16. "北京市" 2011  21347   1228.4
  17. "北京市" 2012  21492   1276.3
  18. "北京市" 2013  21673   1276.7
  19. "北京市" 2014  21849 1284.753
  20. "北京市" 2015  21885 1284.753
  21. "天津市" 1999   8844    529.6
  22. "天津市" 2000   8946    531.2
  23. "天津市" 2001   9647    697.2
  24. "天津市" 2002   9696    681.6
  25. "天津市" 2003  10168    666.3
  26. "天津市" 2004  10514    661.6
  27. "天津市" 2005  10836    664.6
  28. "天津市" 2006  11316    744.7
  29. "天津市" 2007  11531    694.2
  30. "天津市" 2008  12060    764.3
  31. "天津市" 2009  14316   781.49
  32. "天津市" 2010  14832    781.5
  33. "天津市" 2011  15163    866.9
  34. "天津市" 2012  15391    867.7
  35. "天津市" 2013  15718    963.4
  36. "天津市" 2014  16110  970.927
  37. "天津市" 2015  16550 1043.743
  38. "河北省" 1999  58162   3619.4
  39. "河北省" 2000  59152   3631.9
  40. "河北省" 2001  62615   4570.9
  41. "河北省" 2002  63079   4585.7
  42. "河北省" 2003  65391     4744
  43. "河北省" 2004  70200   4671.5
  44. "河北省" 2005  75894     4652
  45. "河北省" 2006 143778   4818.2
  46. "河北省" 2007 147265   4837.8
  47. "河北省" 2008 149503   4853.5
  48. "河北省" 2009 152135 4880.286
  49. "河北省" 2010 154344   4916.4
  50. "河北省" 2011 156965   5170.5
  51. "河北省" 2012 163045   5630.3
  52. "河北省" 2013 174492   6255.5
  53. "河北省" 2014 179200 6252.766
  54. "河北省" 2015 184553 6958.106
  55. end
复制代码


谢谢黄老师的解答,数据如上所示,如何生成新的观测值,province为京津冀地区,其每个年份的road和rail等于北京、天津和河北各年份road和rail的和?

使用道具

板凳
蓝色 发表于 2018-7-16 13:29:47 |只看作者 |坛友微信交流群
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str24 province int year long road double rail
  4. "北京市" 1999  12825   1141.1
  5. "北京市" 2000  13597   1140.9
  6. "北京市" 2001  13891   1160.6
  7. "北京市" 2002  14359   1138.1
  8. "北京市" 2003  14453   1136.1
  9. "北京市" 2004  14630   1124.6
  10. "北京市" 2005  14696   1125.4
  11. "北京市" 2006  20503   1121.5
  12. "北京市" 2007  20754   1119.9
  13. "北京市" 2008  20340   1166.5
  14. "北京市" 2009  20755 1169.459
  15. "北京市" 2010  21114   1169.4
  16. "北京市" 2011  21347   1228.4
  17. "北京市" 2012  21492   1276.3
  18. "北京市" 2013  21673   1276.7
  19. "北京市" 2014  21849 1284.753
  20. "北京市" 2015  21885 1284.753
  21. "天津市" 1999   8844    529.6
  22. "天津市" 2000   8946    531.2
  23. "天津市" 2001   9647    697.2
  24. "天津市" 2002   9696    681.6
  25. "天津市" 2003  10168    666.3
  26. "天津市" 2004  10514    661.6
  27. "天津市" 2005  10836    664.6
  28. "天津市" 2006  11316    744.7
  29. "天津市" 2007  11531    694.2
  30. "天津市" 2008  12060    764.3
  31. "天津市" 2009  14316   781.49
  32. "天津市" 2010  14832    781.5
  33. "天津市" 2011  15163    866.9
  34. "天津市" 2012  15391    867.7
  35. "天津市" 2013  15718    963.4
  36. "天津市" 2014  16110  970.927
  37. "天津市" 2015  16550 1043.743
  38. "河北省" 1999  58162   3619.4
  39. "河北省" 2000  59152   3631.9
  40. "河北省" 2001  62615   4570.9
  41. "河北省" 2002  63079   4585.7
  42. "河北省" 2003  65391     4744
  43. "河北省" 2004  70200   4671.5
  44. "河北省" 2005  75894     4652
  45. "河北省" 2006 143778   4818.2
  46. "河北省" 2007 147265   4837.8
  47. "河北省" 2008 149503   4853.5
  48. "河北省" 2009 152135 4880.286
  49. "河北省" 2010 154344   4916.4
  50. "河北省" 2011 156965   5170.5
  51. "河北省" 2012 163045   5630.3
  52. "河北省" 2013 174492   6255.5
  53. "河北省" 2014 179200 6252.766
  54. "河北省" 2015 184553 6958.106
  55. end

  56. tempfile a
  57. save "a",replace

  58. collapse (sum) road rail,by(year)
  59. gen str24 province="京津冀"
  60. append using "a.dta"
  61. order province
  62. sort year province
复制代码


已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Sunknownay + 3 + 3 + 3 精彩帖子
逐梦的太阳 + 20 + 5 + 5 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 8  热心指数 + 8  信用等级 + 3   查看全部评分

使用道具

报纸
忧壑空谷兰 发表于 2018-7-16 15:45:49 |只看作者 |坛友微信交流群
非常感谢蓝色的回答,完美的解决了问题!再次感谢!

使用道具

地板
黃河泉 在职认证  发表于 2018-7-16 16:00:44 |只看作者 |坛友微信交流群
忧壑空谷兰 发表于 2018-7-16 11:18
谢谢黄老师的解答,数据如上所示,如何生成新的观测值,province为京津冀地区,其每个年份的road和rail ...
请见楼上蓝色版主之解答。

使用道具

7
黃河泉 在职认证  发表于 2018-7-16 16:01:02 |只看作者 |坛友微信交流群
忧壑空谷兰 发表于 2018-7-16 11:18
谢谢黄老师的解答,数据如上所示,如何生成新的观测值,province为京津冀地区,其每个年份的road和rail ...
但请问楼主这样做有什么特别用意吗?

使用道具

8
忧壑空谷兰 发表于 2018-7-16 17:16:51 |只看作者 |坛友微信交流群
没有什么特别用意,就是突然想到这个问题发现自己不会用stata实现,然后很好奇怎么做

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 10:32