4743 4

[面板数据求助] stata的文字数据处理 [推广有奖]

  • 0关注
  • 0粉丝

本科生

38%

还不是VIP/贵宾

-

威望
0
论坛币
18 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
6965 点
帖子
36
精华
0
在线时间
120 小时
注册时间
2016-4-15
最后登录
2019-6-20

楼主
西瓜头小锅锅 发表于 2017-11-9 21:39:23 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
大家好,最近在处理企业海外营业收入问题,id表示企业代码,year为年份,Fn04802为地区,Fn04805为各地区收入占比,并不是每个企业都有海外营业收入,例子中就没有,我想有没有什么命令可以呈现出各个地区在数据库中列示的方式以及出现的频数之类的,因为有的企业是直接写的国外收入或者海外地区,有的是美国英国等需要加总,不想一个个手动完成,所以想看看国内各地区有哪些列示的方式,然后用if语句strmatch等drop 掉,剩下的就是海外收入了,也不知道自己想的对不对,求大神指点!!!
  1. * Example generated by -dataex-. To install: ssc        install        dataex
  2. clear
  3. input float(id year) str82 Fn04802 str18 Fn04805
  4. 1 2009 "华北东北地区"   "17.2291"         
  5. 1 2009 "华东地区"       "27.4448"         
  6. 1 2009 "华南、华中地区" "49.4442"         
  7. 1 2009 "西南地区"       "5.882"            
  8. 1 2009 "总计"           "100"              
  9. 1 2010 "华北、东北地区" "16.0137"         
  10. 1 2010 "华东地区"       "30.263"           
  11. 1 2010 "华南、华中地区" "47.1812"         
  12. 1 2010 "西南地区"       "6.542"            
  13. 1 2010 "总计"           "100"              
  14. 1 2011 "北区"           "12.7686"         
  15. 1 2011 "东区"           "29.0456"         
  16. 1 2011 "南区"           "23.8302"         
  17. 1 2011 "西区"           "7.6139"           
  18. 1 2011 "总计"           "100"              
  19. 1 2011 "总行"           "26.7416"         
  20. 1 2012 "北区"           "12.0805"         
  21. 1 2012 "东区"           "29.5119"         
  22. 1 2012 "南区"           "19.5472"         
  23. 1 2012 "西区"           "7.5421"           
  24. 1 2012 "总计"           "100"              
  25. 1 2012 "总行"           "31.3182"         
  26. 1 2013 "北区"           "17.3217"         
  27. 1 2013 "东区"           "26.5382"         
  28. 1 2013 "南区"           "28.6421"         
  29. 1 2013 "西区"           "10.7781"         
  30. 1 2013 "总计"           "100"              
  31. 1 2013 "总行"           "16.72"            
  32. 1 2014 "北区"           "18.1045"         
  33. 1 2014 "东区"           "20.3632"         
  34. 1 2014 "南区"           "23.6898"         
  35. 1 2014 "西区"           "9.628500000000001"
  36. 1 2014 "总计"           "100"              
  37. 1 2014 "总行"           "28.2139"         
  38. 1 2015 "北区"           "16.4897"         
  39. 1 2015 "东区"           "17.0918"         
  40. 1 2015 "南区"           "21.4948"         
  41. 1 2015 "西区"           "8.763199999999999"
  42. 1 2015 "总计"           "100"              
  43. 1 2015 "总行"           "36.1605"         
  44. 1 2016 "北区"           "13.9488"         
  45. 1 2016 "东区"           "20.0074"         
  46. 1 2016 "南区"           "21.2199"         
  47. 1 2016 "西区"           "8.275499999999999"
  48. 1 2016 "总计"           "100"              
  49. 1 2016 "总行"           "36.5483"         
  50. end
复制代码

     



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 数据处理 tata generated generate

回帖推荐

我是小肚肚 发表于3楼  查看完整内容

试试这个: tab Fn04802 然后找出你要的海外 keep if Fn04802=="..."

沙发
西瓜头小锅锅 发表于 2017-11-9 21:43:46
就是Fn04802包括华东地区、华南地区、东区、西区、北区、南区这样不重复列示出来,像sum一样,我想看看有没有什么规律可以用来drop。

藤椅
我是小肚肚 发表于 2017-11-10 09:32:50
试试这个:
tab Fn04802
然后找出你要的海外  keep if Fn04802=="..."

板凳
西瓜头小锅锅 发表于 2017-11-10 14:19:59
我是小肚肚 发表于 2017-11-10 09:32
试试这个:
tab Fn04802
然后找出你要的海外  keep if Fn04802=="..."
谢谢,我昨天的样本量太大,用了tab Fn04802 Stata显示too many variables,然后我使用条件语句drop掉了一部分数据,可以用tab了

报纸
我是小肚肚 发表于 2017-11-10 15:21:16
西瓜头小锅锅 发表于 2017-11-10 14:19
谢谢,我昨天的样本量太大,用了tab Fn04802 Stata显示too many variables,然后我使用条件语句drop掉了一 ...
不谢不谢 哈哈

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 05:47