楼主: 小明爱演戏
1899 6

[编程问题求助] 如何分类求和,求stata数据处理代码 [推广有奖]

  • 0关注
  • 0粉丝

高中生

20%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
221 点
帖子
14
精华
0
在线时间
18 小时
注册时间
2019-2-6
最后登录
2021-12-7

楼主
小明爱演戏 发表于 2021-3-25 11:20:40 |AI写论文
19论坛币
原始数据如下:

----------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str6 证券代码 str10 统计截止日期 byte 持股排名 float 持股比例 str37 股东性质
  4. "000001" "2019-12-31"  1 49.56 "其他"               
  5. "000001" "2019-12-31"  2  7.75 "境外法人"         
  6. "000001" "2019-12-31"  3  6.11 "其他"               
  7. "000001" "2019-12-31"  4  2.27 "其他"               
  8. "000001" "2019-12-31"  5  2.21 "境内非国有法人"
  9. "000001" "2019-12-31"  6  1.11 "国有法人"         
  10. "000001" "2019-12-31"  7   .84 "境内非国有法人"
  11. "000001" "2019-12-31"  8   .53 "境内非国有法人"
  12. "000001" "2019-12-31"  9   .34 "国家"               
  13. "000001" "2019-12-31" 10   .31 "其他"               
  14. "000002" "2019-12-31"  1 28.69 "国有法人"         
  15. "000002" "2019-12-31"  2 13.96 "境外法人"         
  16. "000002" "2019-12-31"  3  4.32 "境外法人"         
  17. "000002" "2019-12-31"  4  4.04 "其他"               
  18. "000002" "2019-12-31"  5  3.57 "境内非国有法人"
  19. "000002" "2019-12-31"  6  3.04 "其他"               
  20. "000002" "2019-12-31"  7  2.91 "其他"               
  21. "000002" "2019-12-31"  8  1.68 "国有法人"         
  22. "000002" "2019-12-31"  9  1.17 "国有法人"         
  23. "000002" "2019-12-31" 10   .86 "其他"               
  24. "000004" "2019-12-31"  1 28.43 "境内非国有法人"
  25. "000004" "2019-12-31"  2  6.43 "境内非国有法人"
  26. "000004" "2019-12-31"  3  5.01 "其他"               
  27. "000004" "2019-12-31"  4  3.01 "境内自然人"      
  28. "000004" "2019-12-31"  5  2.48 "境内非国有法人"
  29. "000004" "2019-12-31"  6  2.43 "境内自然人"      
  30. "000004" "2019-12-31"  7  1.79 "境内自然人"      
  31. "000004" "2019-12-31"  8  1.75 "其他"               
  32. "000004" "2019-12-31"  9  1.59 "境内自然人"      
  33. "000004" "2019-12-31" 10  1.57 "境内自然人"      
  34. "000005" "2019-12-31"  1 17.41 "境外法人"         
  35. "000005" "2019-12-31"  2  4.53 "境内非国有法人"
  36. "000005" "2019-12-31"  3  1.91 "境内自然人"      
  37. "000005" "2019-12-31"  4  1.87 "境内自然人"      
  38. "000005" "2019-12-31"  5   .88 "国有法人"         
  39. "000005" "2019-12-31"  6   .62 "境内自然人"      
  40. "000005" "2019-12-31"  7   .59 "境内非国有法人"
  41. "000005" "2019-12-31"  8   .57 "境内自然人"      
  42. "000005" "2019-12-31"  9   .51 "境内非国有法人"
  43. "000005" "2019-12-31" 10   .41 "境内非国有法人"
  44. "000006" "2019-12-31"  1 21.93 "国家"               
  45. "000006" "2019-12-31"  2 14.07 "国有法人"         
  46. "000006" "2019-12-31"  3  3.51 "国有法人"         
  47. "000006" "2019-12-31"  4  1.08 "国有法人"         
  48. "000006" "2019-12-31"  5  1.03 "境外法人"         
  49. "000006" "2019-12-31"  6   .71 "其他"               
  50. "000006" "2019-12-31"  7   .65 "境内自然人"      
  51. "000006" "2019-12-31"  8   .51 "境内自然人"      
  52. "000006" "2019-12-31"  9   .48 "境内自然人"      
  53. "000006" "2019-12-31" 10   .36 "境内自然人"      
  54. "000007" "2019-12-31"  1 21.65 "境内非国有法人"
  55. "000007" "2019-12-31"  2 10.82 "境内非国有法人"
  56. "000007" "2019-12-31"  3  3.89 "境内自然人"      
  57. "000007" "2019-12-31"  4  2.83 "境内自然人"      
  58. "000007" "2019-12-31"  5  2.18 "境内自然人"      
  59. "000007" "2019-12-31"  6  2.13 "境内自然人"      
  60. "000007" "2019-12-31"  7  1.37 "境内自然人"      
  61. "000007" "2019-12-31"  8   .83 "境内非国有法人"
  62. "000007" "2019-12-31"  9    .7 "境内自然人"      
  63. "000007" "2019-12-31" 10   .66 "境内自然人"      
  64. "000008" "2019-12-31"  1 22.92 "国有法人"         
  65. "000008" "2019-12-31"  2 12.59 "国有法人"         
  66. "000008" "2019-12-31"  3  5.51 "境内自然人"      
  67. "000008" "2019-12-31"  4  1.27 "其他"               
  68. "000008" "2019-12-31"  5  1.16 "其他"               
  69. "000008" "2019-12-31"  6   1.1 "国有法人"         
  70. "000008" "2019-12-31"  7  1.09 "境内自然人"      
  71. "000008" "2019-12-31"  8   .79 "境内非国有法人"
  72. "000008" "2019-12-31"  9   .77 "国家"               
  73. "000008" "2019-12-31" 10   .71 "其他"               
  74. "000009" "2019-12-31"  1 11.91 "境内非国有法人"
  75. "000009" "2019-12-31"  2  5.57 "国有法人"         
  76. "000009" "2019-12-31"  3  4.95 "境内自然人"      
  77. "000009" "2019-12-31"  4  1.22 "境外法人"         
  78. "000009" "2019-12-31"  5   .86 "境内非国有法人"
  79. "000009" "2019-12-31"  6   .82 "境内自然人"      
  80. "000009" "2019-12-31"  7   .79 "其他"               
  81. "000009" "2019-12-31"  8   .69 "境内自然人"      
  82. "000009" "2019-12-31"  9   .59 "境内自然人"      
  83. "000009" "2019-12-31" 10   .43 "境内自然人"      
  84. "000010" "2019-12-31"  1 14.57 "境内非国有法人"
  85. "000010" "2019-12-31"  2  5.43 "境内非国有法人"
  86. "000010" "2019-12-31"  3  4.77 "境内非国有法人"
  87. "000010" "2019-12-31"  4  4.63 "境内非国有法人"
  88. "000010" "2019-12-31"  5  3.51 "国有法人"         
  89. "000010" "2019-12-31"  6     3 "境内非国有法人"
  90. "000010" "2019-12-31"  7  2.92 "境内自然人"      
  91. "000010" "2019-12-31"  8  2.77 "境内自然人"      
  92. "000010" "2019-12-31"  9  2.59 "境内非国有法人"
  93. "000010" "2019-12-31" 10  1.84 "国有法人"         
  94. "000011" "2019-12-31"  1 63.82 "国有法人"         
  95. "000011" "2019-12-31"  2   .29 "境内非国有法人"
  96. "000011" "2019-12-31"  3   .24 "境内自然人"      
  97. "000011" "2019-12-31"  4    .2 "境内自然人"      
  98. "000011" "2019-12-31"  5    .2 "境内自然人"      
  99. "000011" "2019-12-31"  6   .18 "境内自然人"      
  100. "000011" "2019-12-31"  7   .15 "境内自然人"      
  101. "000011" "2019-12-31"  8   .15 "境内自然人"      
  102. "000011" "2019-12-31"  9   .14 "境内非国有法人"
  103. "000011" "2019-12-31" 10   .13 "境内自然人"      
  104. end
复制代码

------------------ copy up to and including the previous line ------------------





我想分类求和,即求该年度该股票各类股东持有股票数量的总和
以下是上述数据的一个结果示范
  1. ----------------------- copy starting from the next line -----------------------
  2. [CODE]
  3. * Example generated by -dataex-. To install: ssc install dataex
  4. clear
  5. input str6 行标签 int 年份 float(国家 国有法人 境内非国有法人 境内自然人) byte 境内自然人境内非国有法人 float 境外法人 byte 境外自然人 float(其他 总计)
  6. "000001" 2019   .34  1.11  3.58     . .  7.75 . 58.25 71.03
  7. "000002" 2019     . 31.54  3.57     . . 18.28 . 10.85 64.24
  8. "000004" 2019     .     . 37.34 10.39 .     . .  6.76 54.49
  9. "000005" 2019     .   .88  6.04  4.97 . 17.41 .     .  29.3
  10. "000006" 2019 21.93 18.66     .     2 .  1.03 .   .71 44.33
  11. "000007" 2019     .     .  33.3 13.76 .     . .     . 47.06
  12. "000008" 2019   .77 36.61   .79   6.6 .     . .  3.14 47.91
  13. "000009" 2019     .  5.57 12.77  7.48 .  1.22 .   .79 27.83
  14. "000010" 2019     .  5.35 34.99  5.69 .     . .     . 46.03
  15. "000011" 2019     . 63.82   .43  1.25 .     . .     .  65.5
  16. end
复制代码

------------------ copy up to and including the previous line ------------------[/code]还望各位大神不吝赐教!



最佳答案

关键词:stata数据处理 STATA数据 数据处理代码 Stata 数据处理

回帖推荐

黃河泉 发表于2楼  查看完整内容

请试试

沙发
黃河泉 在职认证  发表于 2021-3-25 11:20:41
请试试
  1. gen ymd = date(统计截止日期,"YMD")
  2. gen year = year(ymd)
  3. collapse (sum) 持股比例, by(证券代码 year 股东性质)
  4. reshape wide 持股比例, i(证券代码 year) j(股东性质) string
  5. egen 总计 = rowtotal(持股比例*)
  6. ren 持股比例* *
复制代码

藤椅
小明爱演戏 发表于 2021-3-25 11:45:04
黃河泉 发表于 2021-3-25 11:33
请试试
太感谢黄老师了!!!!!
昨天折腾了我一天,总算解决了!!

板凳
小明爱演戏 发表于 2021-4-6 12:29:58
黃河泉 发表于 2021-3-25 11:20
请试试
----------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str6 证券代码 str25 股东性质 float year double 持股比例
  4. "200053" "境内自然人"       2014 .30000001192092896
  5. "200053" "境内非国有法人" 2014 51.790000915527344
  6. "200053" "境外法人"          2014  24.10999971628189
  7. "200054" "国有法人"          2014  71.12999725341797
  8. "200054" "境内自然人"       2014 4.4599999487400055
  9. "200054" "境内非国有法人" 2014 1.4700000286102295
  10. "200054" "境外法人"          2014 1.0499999523162842
  11. "200152" "国有法人"          2014  64.79999923706055
  12. "200152" "境内自然人"       2014  1.270000010728836
  13. "200152" "境外法人"          2014 1.7999999821186066
  14. "200160" "境内自然人"       2014  34.65999972820282
  15. "200160" "境内非国有法人" 2014  2.619999885559082
  16. "200160" "境外法人"          2014 20.810000360012054
  17. "200168" "境内自然人"       2014  3.259999990463257
  18. "200168" "境内非国有法人" 2014  51.48000192642212
  19. "200168" "境外法人"          2014 11.540000319480896
  20. "200168" "境外自然人"       2014 .36000001430511475
  21. "200468" "国有法人"          2014   53.4900016784668
  22. "200468" "境内自然人"       2014  2.990000009536743
  23. "200468" "境外法人"          2014  4.260000109672546
  24. "200468" "境外自然人"       2014  1.840000033378601
  25. "200512" "境内自然人"       2014  2.060000002384186
  26. "200512" "境外法人"          2014   45.8400003015995
  27. "200512" "境外自然人"       2014 1.7799999713897705
  28. "200706" "国有法人"          2014 60.599998474121094
  29. "200706" "境内自然人"       2014 1.1699999943375587
  30. "200706" "境外法人"          2014 20.520000748336315
  31. "200706" "境外自然人"       2014  .3100000023841858
  32. "200770" "国有法人"          2014  6.909999847412109
  33. "200770" "境内自然人"       2014  3.300000011920929
  34. "200770" "境外法人"          2014 51.860000014305115
  35. "200771" "国有法人"          2014  63.63999938964844
  36. "200771" "境内自然人"       2014  .5200000107288361
  37. "200771" "境外法人"          2014 2.5799999982118607
  38. "200986" "国有法人"          2014 .23000000417232513
  39. "200986" "境内自然人"       2014 1.3499999940395355
  40. "200986" "境内非国有法人" 2014  65.19999694824219
  41. "200986" "境外法人"          2014 .41999998688697815
  42. "200986" "境外自然人"       2014  .5099999904632568
  43. "200992" "国有法人"          2014 47.980000019073486
  44. "200992" "境外法人"          2014  8.320000171661377
  45. "200992" "境外自然人"       2014  3.920000046491623
  46. "300001" "其他"                2014  4.379999816417694
  47. "300001" "国家"                2014 .41999998688697815
  48. "300001" "境内自然人"       2014 10.259999871253967
  49. "300001" "境内非国有法人" 2014 49.779998779296875
  50. "300001" "境外自然人"       2014  3.359999895095825
  51. "300002" "境内自然人"       2014   56.4499990940094
  52. "300003" "其他"                2014 14.159999966621399
  53. "300003" "国有法人"          2014 24.989999532699585
  54. "300003" "境内自然人"       2014 13.039999961853027
  55. "300003" "境内非国有法人" 2014                  3
  56. "300003" "境外法人"          2014  7.630000114440918
  57. "300004" "其他"                2014 3.4000000953674316
  58. "300004" "国家"                2014  .9399999976158142
  59. "300004" "境内自然人"       2014 53.769999504089355
  60. "300005" "其他"                2014  6.159999966621399
  61. "300005" "国家"                2014 1.5499999523162842
  62. "300005" "境内自然人"       2014  43.81000018119812
  63. "300006" "其他"                2014 13.400000095367432
  64. "300006" "国有法人"          2014 3.2699999809265137
  65. "300006" "境内自然人"       2014  39.36999988555908
  66. "300006" "境内非国有法人" 2014 1.3899999856948853
  67. "300007" "其他"                2014 3.9199999570846558
  68. "300007" "境内自然人"       2014  44.81999933719635
  69. "300007" "境内非国有法人" 2014 1.3799999952316284
  70. "300008" "其他"                2014 2.9299999475479126
  71. "300008" "国有法人"          2014 1.3899999856948853
  72. "300008" "境内自然人"       2014 25.009999632835388
  73. "300008" "境内非国有法人" 2014  23.99000072479248
  74. "300009" "其他"                2014  2.100000023841858
  75. "300009" "境内自然人"       2014  43.81999891996384
  76. "300009" "境外法人"          2014  .6800000071525574
  77. "300010" "其他"                2014  2.509999990463257
  78. "300010" "境内自然人"       2014  37.42999970912933
  79. "300010" "境内非国有法人" 2014                  9
  80. "300011" "其他"                2014 2.0100000500679016
  81. "300011" "国家"                2014  .9800000190734863
  82. "300011" "境内自然人"       2014  42.01000016927719
  83. "300011" "境内非国有法人" 2014 20.029999494552612
  84. "300012" "其他"                2014   9.34000015258789
  85. "300012" "国家"                2014 1.7300000190734863
  86. "300012" "境内自然人"       2014  49.58000040054321
  87. "300013" "其他"                2014 3.9000000953674316
  88. "300013" "境内自然人"       2014 12.910000145435333
  89. "300013" "境内非国有法人" 2014 23.869999527931213
  90. "300014" "其他"                2014 .23999999463558197
  91. "300014" "境内自然人"       2014  8.520000100135803
  92. "300014" "境内非国有法人" 2014   45.7400016784668
  93. "300014" "境外自然人"       2014 1.7100000381469727
  94. "300015" "其他"                2014 4.7200000286102295
  95. "300015" "国家"                2014   .550000011920929
  96. "300015" "境内自然人"       2014  24.58999991416931
  97. "300015" "境内非国有法人" 2014   44.0099983215332
  98. "300016" "其他"                2014  13.53000020980835
  99. "300016" "国家"                2014 1.6299999952316284
  100. "300016" "国有法人"          2014  9.850000381469727
  101. "300016" "境内自然人"       2014 24.880000352859497
  102. "300016" "境内非国有法人" 2014 13.609999656677246
  103. "300017" "其他"                2014  9.990000128746033
  104. end
复制代码
------------------ copy up to and including the previous line ------------------

Listed 100 out of 4912 observations
Use the count() option to list more

老师好我还想请教一下,为什么reshape命令对证券代码非000开头的股票命令就失效了呢?如以上的数据(以上数据为执行到collapse的阶段),我的stata报错:
(note: j = 其他 国家 国有法人 国有法人,境外法人 境内自然人 境内非国有法人 境外法
> 人 境外自然人)
, not allowed
r(101);

end of do-file

报纸
黃河泉 在职认证  发表于 2021-4-6 15:59:31
小明爱演戏 发表于 2021-4-6 12:29
----------------------- copy starting from the next line ----------------------------------------- ...
不懂你的问题 (请直接说明你要什么样的结果)!

地板
dengsuling 学生认证  发表于 2021-4-6 16:36:38

7
小明爱演戏 发表于 2021-4-12 22:49:04
黃河泉 发表于 2021-4-6 15:59
不懂你的问题 (请直接说明你要什么样的结果)!
----------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str12 证券代码 str6 年份 str27 境内自然人 str33 境内非国有法人 str24(境外法人 国有法人) str18 国家持股
  4. "证券代码" "年份" "境内自然人持股比例" "境内非国有法人持股比例" "境外法人持股比例" "国有法人持股比例" "国家持股比例"
  5. end
复制代码
------------------ copy up to and including the previous line ------------------

Listed 1 out of 1 observations
老师好!我想得到的结果的数据结构如上所示
数据为4月6日回答中的数据
从第三列开始,为当年该证券这一性质股东对应的持股比例
从第三列开始,有多少种性质就有多少列

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-7 14:49