楼主: yuren1982
3394 14

[数据管理求助] 智商捉急,真心求助!大数据求份额指标 [推广有奖]

  • 0关注
  • 11粉丝

已卖:1021份资源

副教授

16%

还不是VIP/贵宾

-

威望
0
论坛币
30855 个
通用积分
3.7671
学术水平
25 点
热心指数
13 点
信用等级
25 点
经验
25775 点
帖子
240
精华
1
在线时间
946 小时
注册时间
2005-10-13
最后登录
2024-8-15

楼主
yuren1982 发表于 2014-12-18 20:47:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人写博士论文,但stata实在是菜鸟。请教高手们一个问题:
我在处理中国工业企业数据库的数据,但在处理大数据时遇到很多问题,其中一个问题是:怎样让软件自动求出每家企业的指标值与其所属四位数行业总额的比值?也就是该企业占行业(四位数行业)的份额?
因为四位数行业有一二百个,所以手动工作量实在太大。具体如图,对于很多人来说这可能根本不算个问题,可真是把我难住了。当然不一定非得用stata,能用excel实现更好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据 中国工业企业数据库 工业企业数据库 用excel Stata excel 数据库 工作量 中国 博士

QQ截图20141218203128.png (9.29 KB)

QQ截图20141218203128.png

xt.dta
下载链接: https://bbs.pinggu.org/a-1700237.html

1.1 MB

stata数据

沙发
SpencerMeng 在职认证  发表于 2014-12-23 11:28:48
楼主,建议上传部分dta数据,您上传的这个数据尽量简单明了,方便其他坛友进行操作并提供相关命令。

藤椅
yuren1982 发表于 2014-12-24 12:06:39
SpencerMeng 发表于 2014-12-23 11:28
楼主,建议上传部分dta数据,您上传的这个数据尽量简单明了,方便其他坛友进行操作并提供相关命令。
版主你好,已上传数据,变量分别是企业代码,所属行业代码,工业销售产值。
我的问题就是怎样算出每家企业的销售产值占其所属四位数行业的比重,非常感谢!

板凳
SpencerMeng 在职认证  发表于 2014-12-24 13:07:11
yuren1982 发表于 2014-12-24 12:06
版主你好,已上传数据,变量分别是企业代码,所属行业代码,工业销售产值。
我的问题就是怎样算出每家企 ...
楼主,你好。

我没有看出企业代码和行业代码之间的关联。你说的每家企业的销售产值占其所属四位数行业的比重,其所属四
位数行业是什么?每家企业的代码有零开头的,还有x等字母开头的,行业代码并没有以0或字母开头呀。我没做过产业的,所以不太清楚,静等你的解释。其实你最了解自己的数据了,你就抓住自己数据的特点,自己构造一个简单的数据,并阐释清楚想通过怎么样的计算得到什么样的结果。

报纸
yuren1982 发表于 2014-12-24 15:58:55
SpencerMeng 发表于 2014-12-24 13:07
楼主,你好。

我没有看出企业代码和行业代码之间的关联。你说的每家企业的销售产值占其所属四位数行业 ...
可能是我没有说清楚,所属四位数行业就是数据中第二栏的变量“行业代码”,这个代码不就是四位数嘛:)我的数据来自中国工业企业数据库,企业代码和行业代码之间在形式上本来就没有必然联系。我的意思就是说,将所有具有相同行业代码的企业的销售产值加总,然后用每家企业的销售产值除以其对应的行业的加总值,得到份额指标。不知道我这样说清楚了吗?谢谢斑竹!

地板
SpencerMeng 在职认证  发表于 2014-12-24 16:37:18
yuren1982 发表于 2014-12-24 15:58
可能是我没有说清楚,所属四位数行业就是数据中第二栏的变量“行业代码”,这个代码不就是四位数嘛:)我 ...
我明白了,楼主。我给您在复述一遍哈。把相同行业代码的产值加总,用每个公司的产值除以它。

以下是代码:
  1. clear
  2. inp str16 companycode industrycode industrysale
  3. 111353503        0610        267411
  4. 210351730        0610        124995
  5. 184967637        0610        354609
  6. 228341258        0610        5823
  7. 626900211        0610        5176
  8. 155863425        0610        105200
  9. 158187629        0610        144450
  10. 110542150        0610        30010
  11. 706258599        0610        211301
  12. 141081668        1711        87512
  13. 133639481        1711        115593
  14. 143548161        1711        13300
  15. 183611196        1711        68814
  16. 725444012        2911        346238
  17. 164962978        2911        103425
  18. 163948218        2911        272287
  19. 168970027        2911        160526
  20. end

  21. egen C=group(companycode) //先对每个公司标号
  22. egen I=group(industrycode) //同样的对行业也标号
  23. egen i_sum=sum(industrysale),by(I) //相同行业内部的产值进行加总
  24. gen share_c_isum=industrysale/i_sum //把每个公司的产值除以行业的总产值
复制代码
您看是不是您想要的结果呢。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
txje + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

7
yuren1982 发表于 2014-12-24 22:13:50
SpencerMeng 发表于 2014-12-24 16:37
我明白了,楼主。我给您在复述一遍哈。把相同行业代码的产值加总,用每个公司的产值除以它。

以下是代 ...
exactly!太棒了!感谢版主!这正是我想要的,而且您的代码不仅解决了我这一个问题,还解决了类似的好几个问题,真是太感谢了!我对stata使用完全没有基础,但又着急用,所以很多东西都不知道,感谢版主的无私帮助!
以后如果遇到其他问题,可能还要向您请教,请不吝赐教!

8
SpencerMeng 在职认证  发表于 2014-12-24 22:26:47
yuren1982 发表于 2014-12-24 22:13
exactly!太棒了!感谢版主!这正是我想要的,而且您的代码不仅解决了我这一个问题,还解决了类似的好几 ...
没问题,没问题。呵呵 有事儿您说话!我一个人的力量有限,不过还有千千万万热心坛友为您撑腰呢!

真高兴能解决您的问题~也是我的荣幸!

总之,我和您一样地高兴!

圣诞快乐!!

9
yuren1982 发表于 2014-12-25 08:34:50
SpencerMeng 发表于 2014-12-24 22:26
没问题,没问题。呵呵 有事儿您说话!我一个人的力量有限,不过还有千千万万热心坛友为您撑腰呢!

真高 ...
圣诞快乐!

10
yuren1982 发表于 2015-1-5 17:17:41
SpencerMeng 发表于 2014-12-24 22:26
没问题,没问题。呵呵 有事儿您说话!我一个人的力量有限,不过还有千千万万热心坛友为您撑腰呢!

真高 ...
版主您好!又来麻烦您了,因为又遇到了解决不了的问题
还是跟之前的问题类似,之前我是要对具有相同行业代码的企业的销售产值加总,现在我想更进一步,对行业代码前两位数相同的企业的销售产值加总。因为四位数行业划分很细,数量很多(四五百个),我无法在论文中进行具体分析,需要加总到两位数行业(二三十个)进行分析,所以才有此问题。请版主帮忙,谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 21:06