楼主: 修波
3447 20

[数据管理求助] 请问面板数据分组求和结果不一致怎么解决? [推广有奖]

11
修波 学生认证  发表于 2019-3-14 20:59:28
黃河泉 发表于 2019-3-14 18:23
我们就一步一步来!1. 根据你给的资料 (或者你要发一个更具代表性之资料),我们要删除哪些观察值?请说明 ...
好的,老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令,先分组求和,得到分产业就业量 emp_city,再用duplicates drop命令删除不同地区(shi_id)单个产业(class_xiao)就业量的重复值。例如删除“101”地区中“1312”产业的就业量重复值。删除重复值后计算总就业量 total emp_city , 得到的结果是4.51e+07;
使用第二个命令:重新导入数据,直接计算所有地区、所有产业的总就业量 total emply ,得到的结果是4.56e+07。
您看我这样是否表达清楚问题了

12
黃河泉 在职认证  发表于 2019-3-15 06:39:00
修波 发表于 2019-3-14 20:59
好的,老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令,先分组求和,得 ...
原则上,我尽量不下载别人资料。所以你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。
2.        请参考说明https://bbs.pinggu.org/thread-5048204-1-1.html

13
黃河泉 在职认证  发表于 2019-3-15 06:41:47
修波 发表于 2019-3-14 20:59
好的,老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令,先分组求和,得 ...
如同我前面所讲,你底下所计算的观察值不一样 (你知不知道这点?),结果一样才奇怪呢!
  1. 使用第一个命令,先分组求和,得到分产业就业量 emp_city,再用duplicates drop命令删除不同地区(shi_id)单个产业(class_xiao)就业量的重复值。例如删除“101”地区中“1312”产业的就业量重复值。删除重复值后计算总就业量 total emp_city , 得到的结果是4.51e+07;
复制代码

14
黃河泉 在职认证  发表于 2019-3-15 06:47:01
修波 发表于 2019-3-14 20:59
好的,老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令,先分组求和,得 ...
我怎觉得你现在说的根最原先讲的又不太一样?

15
修波 学生认证  发表于 2019-3-15 09:11:13
黃河泉 发表于 2019-3-15 06:47
我怎觉得你现在说的根最原先讲的又不太一样?
可能是我没表达清楚吧,我最开始是直接把所有命令都贴出来了,包括门类大类和门类小类,还有一些不相关的命令。现在为了把问题说清楚,我就只用了地区、产业分类和就业量三个变量,思路是没有变的。
现在的问题就是,老师您说我“所计算的观察值不一样 ”,但是我的理解就是,利用 duplicates drop 只是删除了分组求和后的重复值,剩下的 emp_city 是同一地区、同一产业下所有企业的就业量合集,依旧是所有企业就业量的总和啊,只是经过了两次求和而已啊。

16
修波 学生认证  发表于 2019-3-15 09:16:20
黃河泉 发表于 2019-3-15 06:39
原则上,我尽量不下载别人资料。所以你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资 ...
嗯,好的。

17
黃河泉 在职认证  发表于 2019-3-15 09:46:20
修波 发表于 2019-3-15 09:11
可能是我没表达清楚吧,我最开始是直接把所有命令都贴出来了,包括门类大类和门类小类,还有一些不相关的 ...
看看底下作法:
  1. use E:\1998.dta, clear

  2. bysort shi_id class_xiao: egen emp_city = sum(emply)
  3. duplicates drop shi_id class_xiao emp_city, force
  4. egen total = total(emp_city)
  5. format %12.2f total
  6. list total in 1/5


  7. use E:\1998.dta, clear

  8. collapse (sum) emply, by(shi_id class_xiao)
  9. *sort shi_id class_xiao
  10. egen total = total(emply)
  11. format %12.2f total
  12. list total in 1/5
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Sunknownay + 3 + 3 + 3 精彩帖子

总评分: 学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

18
黃河泉 在职认证  发表于 2019-3-15 09:47:48
修波 发表于 2019-3-15 09:16
嗯,好的。
两个结果一样:
  1. . use E:\1998.dta, clear
  2. .
  3. . bysort shi_id class_xiao: egen emp_city = sum(emply)

  4. . duplicates drop shi_id class_xiao emp_city, force

  5. Duplicates in terms of shi_id class_xiao emp_city

  6. (98,188 observations deleted)

  7. . egen total = total(emp_city)

  8. . format %12.2f total

  9. . list total in 1/5

  10.      +-------------+
  11.      |       total |
  12.      |-------------|
  13.   1. | 45577260.00 |
  14.   2. | 45577260.00 |
  15.   3. | 45577260.00 |
  16.   4. | 45577260.00 |
  17.   5. | 45577260.00 |
  18.      +-------------+

  19. . use E:\1998.dta, clear

  20. .
  21. . collapse (sum) emply, by(shi_id class_xiao)

  22. . *sort shi_id class_xiao
  23. . egen total = total(emply)

  24. . format %12.2f total

  25. . list total in 1/5

  26.      +-------------+
  27.      |       total |
  28.      |-------------|
  29.   1. | 45577260.00 |
  30.   2. | 45577260.00 |
  31.   3. | 45577260.00 |
  32.   4. | 45577260.00 |
  33.   5. | 45577260.00 |
  34.      +-------------+

  35. . use E:\1998.dta, clear

  36. .
  37. . collapse (sum) emply, by(shi_id class_xiao)

  38. . *sort shi_id class_xiao
  39. . egen total = total(emply)

  40. . format %12.2f total

  41. . list total in 1/5

  42.      +-------------+
  43.      |       total |
  44.      |-------------|
  45.   1. | 45577260.00 |
  46.   2. | 45577260.00 |
  47.   3. | 45577260.00 |
  48.   4. | 45577260.00 |
  49.   5. | 45577260.00 |
  50.      +-------------+
复制代码
  1. . use E:\1998.dta, clear

  2. .
  3. . collapse (sum) emply, by(shi_id class_xiao)

  4. . *sort shi_id class_xiao
  5. . egen total = total(emply)

  6. . format %12.2f total

  7. . list total in 1/5

  8.      +-------------+
  9.      |       total |
  10.      |-------------|
  11.   1. | 45577260.00 |
  12.   2. | 45577260.00 |
  13.   3. | 45577260.00 |
  14.   4. | 45577260.00 |
  15.   5. | 45577260.00 |
  16.      +-------------+
复制代码

19
修波 学生认证  发表于 2019-3-15 11:00:00
黃河泉 发表于 2019-3-15 09:47
两个结果一样:
嗯,验证了一下,老师发的命令是对的,我写的删除重复值的命令 duplicates drop class_xiao emp_city, force 缺少一个shi_id。非常感谢老师耐心指导,解决了我的困惑

20
黃河泉 在职认证  发表于 2019-3-15 11:06:07
修波 发表于 2019-3-15 11:00
嗯,验证了一下,老师发的命令是对的,我写的删除重复值的命令 duplicates drop class_xiao emp_city, fo ...
终于水落石出,呵呵!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 20:13