楼主: StarNo1
3863 15

[其他] 求助!怎样把两组数据再进行二次处理? [推广有奖]

11
StarNo1 发表于 2009-11-18 08:32:18
蓝精灵斑斑的方法貌似可以用,谢谢蓝精灵!也感谢其他的朋友!再次bow...

12
arlionn 在职认证  发表于 2009-11-18 08:36:19
参考sungmoo的思路即可:

gen  group  = string(height) + weight


举个简单的例子:

clear
input height str2 weight
         1     b
         3     c
         2     a
         2     d
         4     a
         5     e
end


gen group = string(height) + weight
list, sep(0)



*-结果如下:
     +-------------------------+
     | height   weight   group |
     |-------------------------|
  1. |      1        b      1b |
  2. |      3        c      3c |
  3. |      2        a      2a |
  4. |      2        d      2d |
  5. |      4        a      4a |
  6. |      5        e      5e |
     +-------------------------+

13
StarNo1 发表于 2009-11-18 10:37:16
每组都分成5个quintile。附上我做的,请各位大大评判:
sort height
xtile hquintile=height, nq(5)
sort weight
xtile wquintile=weight, nq(5)
sort hquintile
sort wquintile
gen group=wquintile*10+hquintile
确实分了25组,可是不知道这样做对不对。另外,如果正确的话,怎样把这25组单独抽出来呢?现在全都在一个“group"下,比如我想得到25个subgroup,怎么做呢?谢谢!

14
StarNo1 发表于 2009-11-18 10:42:35
另外的一种分组做法:
egen wpct1=pctile(weight), p(20)
egen wpct2=pctile(weight), p(40)
egen wpct3=pctile(weight), p(60)
egen wpct4=pctile(weight), p(80)
不知道这两种哪种正确呢?第二种的好处是每一个subgroup已经被单独提出来了,所以到时候和height的那五组结合的时候比较方便。可是不知道具体该怎么结合。

15
StarNo1 发表于 2009-11-18 11:05:40
group |      Freq.     Percent        Cum.
------------+-----------------------------------
         11 |      6,586        7.08        7.08
         12 |      4,074        4.38       11.46
         13 |      3,102        3.34       14.80
         14 |      2,364        2.54       17.34
         15 |      1,811        1.95       19.29
         21 |      3,426        3.68       22.97
         22 |      3,694        3.97       26.94
         23 |      3,808        4.09       31.04
         24 |      3,932        4.23       35.26
         25 |      3,860        4.15       39.42
         31 |      2,825        3.04       42.45
         32 |      3,477        3.74       46.19
         33 |      3,741        4.02       50.21
         34 |      4,178        4.49       54.71
         35 |      4,561        4.90       59.61
         41 |      2,633        2.83       62.44
         42 |      3,698        3.98       66.42
         43 |      3,919        4.21       70.63
         44 |      3,919        4.21       74.85
         45 |      4,631        4.98       79.83
         51 |      3,249        3.49       83.32
         52 |      4,223        4.54       87.86
         53 |      4,172        4.49       92.35
         54 |      3,553        3.82       96.17
         55 |      3,566        3.83      100.00
------------+-----------------------------------
      Total |     93,002      100.00

16
ctx5518 发表于 2009-11-20 12:05:14
首先确定身高编号为字符型变量还是数值型变量。
如果是字符型,假定身高和体重分别为变量height, weight,合成变量为hw.  
         egen hw=concat(height weight)
如果是数值型,
     gen h1=string(height)
          egen hw=concat(h1 weight)
         drop h1

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-25 22:59