楼主: WARM-KILLER
4746 10

[面板数据求助] 请问如何求同一行业但位于其他省份的企业平均值呢? [推广有奖]

  • 0关注
  • 0粉丝

硕士生

46%

还不是VIP/贵宾

-

威望
0
论坛币
421 个
通用积分
9.0632
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
845 点
帖子
30
精华
0
在线时间
333 小时
注册时间
2015-9-8
最后登录
2025-10-9

楼主
WARM-KILLER 发表于 2020-8-16 16:52:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我有一个六年的平衡面板数据,我想计算同一行业但位于其他省份(和自身所在地不同)的企业的平均值?请问在stata里怎么解决呢? 万分感谢!!谢谢大家!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:平均值 Stata 平衡面板 万分感谢 tata

沙发
WARM-KILLER 发表于 2020-8-16 17:00:38
id        year         value        industry        province
1        2001        4        1        a
1        2002        5        1        a
1        2003        6        1        a
1        2004        3        1        a
1        2005        5        1        a
1        2006        7        1        a
2        2001        4        1        b
2        2002        2        1        b
2        2003        4        1        b
2        2004        5        1        b
2        2005        6        1        b
2        2006        7        1        b
3        2001        5        1        c
3        2002        3        1        c
3        2003        4        1        c
3        2004        5        1        c
3        2005        6        1        c
3        2006        7        1        c
以以上数据为例,对企业1来说,就是求行业1省份b和c的均值,对企业2来说就是求行业1省份a和c的均值

藤椅
DΘstinyじò 发表于 2020-8-16 17:35:14
建议用dataex命令,贴出示例数据。
如果计算还分年份的话,可以试一下:
  1. rangestat (mean) value, interval(industry 0 0)  excludeself by(industry year)
复制代码

板凳
WARM-KILLER 发表于 2020-8-16 20:48:54
DΘstinyじò 发表于 2020-8-16 17:35
建议用dataex命令,贴出示例数据。
如果计算还分年份的话,可以试一下:
谢谢您!不过我要剔除的不仅是自身,还有同一行业同一省份的企业,我在下面贴出来dataex导出的数据,您有空的话可以帮忙看看吗?谢谢啦

报纸
WARM-KILLER 发表于 2020-8-16 20:49:17
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str9 id int year byte industry str4 add float IV
  4. "101509228" 2001 36 "1000"         0
  5. "101509228" 2002 19 "1000"         0
  6. "101509228" 2003 19 "1000"         0
  7. "101509228" 2004 19 "1000"         0
  8. "101509228" 2005 19 "1000"         0
  9. "101509228" 2006 19 "1000"         0
  10. "101517615" 2001 26 "1000"  .1456472
  11. "101517615" 2002 43 "1000"  1.467155
  12. "101517615" 2003 40 "1000"         0
  13. "101517615" 2004 42 "1000"         0
  14. "101517615" 2005 42 "1000"         0
  15. "101517615" 2006 42 "1000"         0
  16. "101520697" 2001 36 "1000"         0
  17. "101520697" 2002 36 "1000"         0
  18. "101520697" 2003 27 "1000"         0
  19. "101520697" 2004 36 "1000"         0
  20. "101520697" 2005 36 "1000"         0
  21. "101520697" 2006 36 "1000"         0
  22. "101522692" 2001 13 "1000"         0
  23. "101522692" 2002 13 "1000"         0
  24. "101522692" 2003 13 "1000"         0
  25. "101522692" 2004 13 "1000" 13.558198
  26. "101522692" 2005 13 "1000"         0
  27. "101522692" 2006 13 "1000"         0
  28. "101524129" 2001 27 "1000"         0
  29. "101524129" 2002 27 "1000"         0
  30. "101524129" 2003 27 "1000"         0
  31. "101524129" 2004 27 "1000"         0
  32. "101524129" 2005 27 "1000"         0
  33. "101524129" 2006 27 "1000"         0
  34. "101537739" 2001 13 "1000"         0
  35. "101537739" 2002 13 "1000"         0
  36. "101537739" 2003 14 "1000"         0
  37. "101537739" 2004 14 "1000"         0
  38. "101537739" 2005 14 "1000"         0
  39. "101537739" 2006 14 "1000"         0
  40. "101582919" 2001 27 "1000"         0
  41. "101582919" 2002 27 "1000"         0
  42. "101582919" 2003 27 "1000"         0
  43. "101582919" 2004 27 "1000"         0
  44. "101582919" 2005 27 "1000"         0
  45. "101582919" 2006 27 "1000"         0
  46. end
复制代码

地板
DΘstinyじò 发表于 2020-8-16 22:00:43
WARM-KILLER 发表于 2020-8-16 20:49
变量要给一下说明哦,新的数据里面哪一个表示省份?对什么求均值?

7
DΘstinyじò 发表于 2020-8-16 22:38:29
之前的数据不具有代表性,您的数据可能是会存在同一年份同一行业同一省份存在多个id情况,之前的代码只能计算同一年份同一行业同一省份只有一个id的情况。
第二次的数据名称是不是弄错了哈?第二次的industry、add、IV是第一次的province、industry、value?目前按照第一次的变量说明,只有下面的笨办法哈哈。试一下:
  1. bys year industry : egen A_sum=sum(value)
  2. bys year industry : egen A_count=count(value)
  3. bys year industry province: egen p_sum=sum(value)
  4. bys year industry province: gen wanted1=(A_sum-p_sum)/(A_count-_N)
复制代码

8
WARM-KILLER 发表于 2020-8-18 18:48:22
DΘstinyじò 发表于 2020-8-16 22:38
之前的数据不具有代表性,您的数据可能是会存在同一年份同一行业同一省份存在多个id情况,之前的代码只能计 ...
非常感谢!感觉应该是可以的!谢谢啦

9
侘傺小浣熊 学生认证  发表于 2020-11-23 23:24:20
DΘstinyじò 发表于 2020-8-16 22:38
之前的数据不具有代表性,您的数据可能是会存在同一年份同一行业同一省份存在多个id情况,之前的代码只能计 ...
大神,请教一下,请问怎么求按照资产规模(size)排名前1%(也就是size降序排列)的企业,同年同行业其他企业的ICD平均值。
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input long(Code Year) float(ICD size) long Ind
  4. 1 1 780.41  5.084088e+11 55
  5. 1 2  859.8  611295559680 55
  6. 1 3 773.35  8.306742e+11 55
  7. 1 4 750.32 1.1653469e+12 55
  8. 1 5 836.33 1.5285794e+12 55
  9. 2 1 679.35     338282592 21
  10. 2 2 563.81     398673504 21
  11. 2 3 703.62     223716288 21
  12. 2 4 373.64     268844288 21
  13. 2 5 540.67     351177472 21
  14. end
  15. label values Code Code
  16. label def Code 1 "000002", modify
  17. label def Code 2 "000004", modify
  18. label values Year Year
  19. label def Year 1 "2014-12-31", modify
  20. label def Year 2 "2015-12-31", modify
  21. label def Year 3 "2016-12-31", modify
  22. label def Year 4 "2017-12-31", modify
  23. label def Year 5 "2018-12-31", modify
  24. label values Ind Ind
  25. label def Ind 21 "C27", modify
  26. label def Ind 55 "K70", modify
复制代码

10
Liyuan_i 学生认证  发表于 2022-7-6 16:48:51
侘傺小浣熊 发表于 2020-11-23 23:24
大神,请教一下,请问怎么求按照资产规模(size)排名前1%(也就是size降序排列)的企业,同年同行业其他 ...
请问您解决了吗?同请教

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-22 07:30