楼主: 修波
3444 20

[数据管理求助] 请问面板数据分组求和结果不一致怎么解决? [推广有奖]

已卖:2727份资源

学科带头人

5%

还不是VIP/贵宾

-

威望
0
论坛币
48131 个
通用积分
85.9641
学术水平
10 点
热心指数
11 点
信用等级
8 点
经验
18590 点
帖子
552
精华
0
在线时间
2574 小时
注册时间
2013-11-12
最后登录
2025-12-25

楼主
修波 学生认证  发表于 2019-3-8 15:31:23 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人使用工业企业数据库就业数据进行分组求和,但是发现分组计算后,不同组的总就业量计算结果是不一致的。根据部分同学提出的采用doule命令,计算结果依旧不一致,请问这种情况应该如何,多谢指教。 1998.dta (1.29 MB)

下面是命令:

  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input float shi_id int class_xiao long emply
  4.   1103 610    22
  5.   3001 610   235
  6. 300035 610 18855
  7.   2609 610   170
  8.   1704 610   140
  9.   3013 610   102
  10.   1216 610   127
  11.   1216 610   122
  12.    606 610 61529
  13.   1216 610   180
  14.   2208 610   167
  15.    602 610  1532
  16.   2211 610   180
  17.   2208 610   414
  18.   1214 610    60
  19.   2207 610   350
  20.   1207 610  1062
  21.   1216 610   652
  22.    510 610  4114
  23.   2208 610   743
  24.   2206 610   297
  25.    703 610    28
  26.   1305 610  1411
  27.   2407 610   390
  28.   1216 610   905
  29.   1821 610 10571
  30.   2201 610   270
  31.   1216 610   160
  32.   2201 610    50
  33.    711 610   178
  34.   2708 610   410
  35. 300030 610   300
  36. 300024 610  1144
  37.   1514 610   610
  38.   1406 610  4971
  39.    805 610   855
  40.   2206 610   260
  41.    810 610    85
  42.   1207 610   356
  43.   1216 610   102
  44.   2711 610  1763
  45.   2202 610   374
  46.    811 610 94715
  47.   1305 610   508
  48.   1216 610   120
  49.   1808 610    14
  50.   1206 610   190
  51.   1216 610   230
  52.   1511 610   286
  53.   1610 610   468
  54. end
复制代码


  1. sort shi_id class_xiao
  2. bysort shi_id class_xiao : egen double emp_city=sum( emply )
  3. duplicates drop class_xiao emp_city, force
  4. drop emply
  5. order shi_id class_xiao
  6. total( emp_city)
复制代码

  1. total (emply)
复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:工业企业数据库 制造业面板数据 专业化指数 企业数据库 计算结果

修波的万花筒

沙发
黃河泉 在职认证  发表于 2019-3-8 15:45:16
你到底是要做什么?请直接说明!

藤椅
修波 学生认证  发表于 2019-3-8 15:54:18
黃河泉 发表于 2019-3-8 15:45
你到底是要做什么?请直接说明!
我对就业数据分别按照城市、行业大类和行业小类进行分组求和,得出了三列数据,但是发现这三列数据的总就业量是不一致的,我就想咨询一下这是怎么回事

板凳
黃河泉 在职认证  发表于 2019-3-8 16:20:26
修波 发表于 2019-3-8 15:54
我对就业数据分别按照城市、行业大类和行业小类进行分组求和,得出了三列数据,但是发现这三列数据的总就 ...
请根据你的资料,说明哪里有问题?

报纸
修波 学生认证  发表于 2019-3-13 20:30:25
黃河泉 发表于 2019-3-8 16:20
请根据你的资料,说明哪里有问题?
问题就是使用和不使用分组求和计算的总就业量不一致,一个为1.09e+09,一个为1.05e+09,想请问老师怎么解决分组求和计算结果不一致的问题

地板
黃河泉 在职认证  发表于 2019-3-14 08:28:24
修波 发表于 2019-3-13 20:30
问题就是使用和不使用分组求和计算的总就业量不一致,一个为1.09e+09,一个为1.05e+09,想请问老师怎么解 ...
看不懂!

7
修波 学生认证  发表于 2019-3-14 12:42:00
黃河泉 发表于 2019-3-14 08:28
看不懂!
[sad] 第一步:我先直接用 total emp  计算了所有地区、所有产业的总就业量为1.09e+09;第二步:按照产业分类计算了不同地区对应的就业量( bysort  shi_id  : egen double emp_city=sum(emp)),再计算total emp_city为1.05e+09。按道理来说 total emp 和 total emp_city 的结果应该是相等的,但是我得到的结果却不一致,我就想问老师如何使 利用分组求和 得到的 emp_city  总就业量 和 total emp 结果一致?

8
黃河泉 在职认证  发表于 2019-3-14 17:01:18
修波 发表于 2019-3-14 12:42
第一步:我先直接用 total emp  计算了所有地区、所有产业的总就业量为1.09e+09;第二步:按照 ...
我实在不想看你的程序,你的
  1. replace emp_da = emp_da[_n-1] if emp_da == .
  2. duplicates drop class_da emp_da , force   
复制代码
  1. replace emp_city = emp_city[_n-1] if emp_city == .
  2. duplicates drop shi_id emp_city , force
复制代码
都会改变资料的多寡,当然与
  1. total  emp_xiao
复制代码
会不一样!

9
修波 学生认证  发表于 2019-3-14 17:31:38
黃河泉 发表于 2019-3-14 17:01
我实在不想看你的程序,你的或都会改变资料的多寡,当然与会不一样!
我是用两张相同内容的表格分开来计算total emp 和 total emp_city,这两个结果互不影响。利用命令( bysort  shi_id  : egen double emp_city=sum(emp))需要删除重复的值,删除重复值之后计算出的 total emp_city 结果就出现了与 total emp  结果不一致的问题。所以才想向老师询问怎么解决两个求和值不一致

10
黃河泉 在职认证  发表于 2019-3-14 18:23:02
修波 发表于 2019-3-14 17:31
我是用两张相同内容的表格分开来计算total emp 和 total emp_city,这两个结果互不影响。利用命令( bysor ...
我们就一步一步来!1. 根据你给的资料 (或者你要发一个更具代表性之资料),我们要删除哪些观察值?请说明。2. 删除完后,要计算哪些东西,也请说清楚,不要再谈你的程式!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 15:32