楼主: zzzzz经济
2427 5

[数据管理求助] 如何用stata描述性统计变量的个数,但是要去掉重复的部分 [推广有奖]

  • 0关注
  • 0粉丝

大专生

75%

还不是VIP/贵宾

-

威望
0
论坛币
358 个
通用积分
0.1541
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
177 点
帖子
16
精华
0
在线时间
93 小时
注册时间
2020-10-3
最后登录
2023-3-15

楼主
zzzzz经济 学生认证  发表于 2021-2-2 22:47:50 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我要计算一个数据中所有河流密度lndensity的个数,每个城市有不同的代码city_code,同时每个city_code对应的lndensity值都是相同的,要如何用sum命令统计出各不相同的lndensity的个数呢?


求助3.PNG
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 描述性统计 tata 描述性 如何用

沙发
zdlspace 学生认证  发表于 2021-2-3 23:24:36
如果我没猜错的话,各不相同的indensity应该就是city_code的个数吧?因为不同的citycode对应相同的indensity,那么有多少个城市就有多少个河流密度。
  1. egen id=group(city_code)
  2. egen wanted=max(id)
复制代码

是这意思么?我没读懂

藤椅
zdlspace 学生认证  发表于 2021-2-3 23:30:17
如果有些城市河流密度相同,要统计各不相同的河流密度,
  1. levelsof indensity
  2. scalar a=r(r)
  3. dis a
复制代码

板凳
zzzzz经济 学生认证  发表于 2021-2-4 15:41:36
zdlspace 发表于 2021-2-3 23:24
如果我没猜错的话,各不相同的indensity应该就是city_code的个数吧?因为不同的citycode对应相同的indensit ...
对的!lndensity应该就是city_code的个数,我刚发完帖子就意识到这个问题了!
感谢您提供的思路,很有帮助~~


但是如果我想用sum命令去描述性统计所有的变量,但是各个变量的情况都不太一样(数据参见附件~),比如lndensity有重复值只计算1次;有的是空缺值,不能计入样本量的个数;有的就是正常统计,要怎么有条理地实现呢??拜托了!第一次用stata做分析,实在有些麻爪儿


expbase.xlsx (1.88 MB)




报纸
zdlspace 学生认证  发表于 2021-2-4 16:48:53
zzzzz经济 发表于 2021-2-4 15:41
对的!lndensity应该就是city_code的个数,我刚发完帖子就意识到这个问题了!
感谢您提供的思路,很有帮 ...
直接用sum即可。Indensity重复并不影响sum中均值,标准误之类的。缺失值也不必考虑,sum会自动统计非缺失值样本量。
  1. . sum

  2.     Variable |        Obs        Mean    Std. Dev.       Min        Max
  3. -------------+---------------------------------------------------------
  4.    lnexport1 |     12,369    3.888223    5.184792          0   18.06609
  5.            y |     12,370    .3762328    .4844591          0          1
  6.     lnexport |      4,654    10.33328    2.199758   .9700209   18.06609
  7. export_ratio |     12,370    .1637698    .3147186          0          1
  8. lnland_cos~p |     12,370   -3.955788    2.120124  -11.20696   9.370687
  9. -------------+---------------------------------------------------------
  10. lnland_cos~s |     12,369   -9.281792    2.481964  -18.08629  -.7503056
  11. land_cost_~n |     12,371   -9.145645    1.363819  -14.47716  -4.568129
  12.    lndensity |     12,074   -10.33842    .3851957  -11.85227  -9.616894
  13.        lntfp |     12,250    7.406541    1.354287   .3021216   13.01285
  14.      lnscale |     12,371      5.6176    1.480055   1.791759     13.502
  15. -------------+---------------------------------------------------------
  16.       lnwage |     12,101    6.869951    .4979131  -.9162907   9.521714
  17.        skill |     12,369    .1834235    .1778491          0          1
  18.         lnkl |     12,355    3.830618    1.442015  -5.703783   15.56609
  19.         lnrd |     12,315   -7.426043    3.082328  -18.01076  -.1816589
  20.       lnelec |     12,371    .7122587    .9525186          0    4.61512
  21. -------------+---------------------------------------------------------
  22. lnfinancost |     10,283   -4.269262    1.699483   -13.0654   2.773421
  23.       lnpgdp |     12,371    9.672478    .6510712   8.190908   11.18438
  24.       lndist |     11,573    5.086541    2.001059          0   8.313117
  25. lnentry_time |     12,371    3.719791     .156653   3.401197   4.043051
  26.          tfp |     12,371    .5048905    .4999963          0          1
  27. -------------+---------------------------------------------------------
  28.          soe |     12,371    .1605367    .3671179          0          1
  29.    city_code |     12,371    3630.805    1344.713       1100       6501
  30. county_code |     12,371    363111.4    134466.3     110101     650108
  31.     ind_code |     12,371     28.6356    8.532724         13         42
复制代码
看一下这张表你就明白了

地板
zzzzz经济 学生认证  发表于 2021-2-4 21:14:47
zdlspace 发表于 2021-2-4 16:48
直接用sum即可。Indensity重复并不影响sum中均值,标准误之类的。缺失值也不必考虑,sum会自动统计非缺失 ...
喔!恍然大悟~~太太太感谢啦!祝您小年快乐鸭~(≧∇≦)ノ

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 07:54