楼主: 那这样吧
11358 8

[数据管理求助] 请教stata如何取数据的前20% [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

初中生

14%

还不是VIP/贵宾

-

威望
0
论坛币
13 个
通用积分
0.0642
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
585 点
帖子
9
精华
0
在线时间
6 小时
注册时间
2014-6-7
最后登录
2017-10-11

楼主
那这样吧 发表于 2017-9-5 13:14:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大侠,小弟刚接触STATA,需要选取某一变量的前20%,求教各位大侠如何处理,感激不尽!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 各位大侠 感激不尽

回帖推荐

刘盼成 发表于2楼  查看完整内容

你这个意思没表述清楚,你是想要样本的前20%个观测值,还是按照大小排序之后取前20%? 由于我这没有stata这个软件,你也没有贴出样本数据。我就按照自己的理解试试(以stata自带的auto.dta为例) 一、样本的20%个样本 二、按照从大到小排序的20%的样本,以price为例

沙发
magicsun 发表于 2017-9-5 14:48:49 来自手机
那这样吧 发表于 2017-9-5 13:14
各位大侠,小弟刚接触STATA,需要选取某一变量的前20%,求教各位大侠如何处理,感激不尽!!!
手机看不到。

藤椅
那这样吧 发表于 2017-9-5 14:49:24
刘盼成 发表于 2017-9-5 14:20
你这个意思没表述清楚,你是想要样本的前20%个观测值,还是按照大小排序之后取前20%?
由于我这没有stata这 ...
谢谢,谢谢,我现在已经会了。

板凳
黃河泉 在职认证  发表于 2017-9-5 17:12:41
尔后建議用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 https://bbs.pinggu.org/thread-5048204-1-1.htmlhttps://bbs.pinggu.org/thread-5917273-1-1.html

报纸
jessica-kxy 发表于 2020-10-31 16:01:36
为什么我写list in 0.2*N,会显示'0.2' invalid observation number

地板
曹越越越越越 发表于 2021-12-16 17:35:08
黃河泉 发表于 2017-9-5 17:12
尔后建議用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料列出 ...
请教您一个问题,打扰啦,如何保留每一年度每一行业前百分之三十的age的数据,以及每一年度每一行业后百分之三十的数据
stkcd        year        industry        birth        age
1        2016        J        1991        25
1        2018        J        1991        27
1        2017        J        1991        26
1        2015        J        1991        24
1        2019        J        1991        28
1        2020        J        1991        29
2        2020        K        1991        29
2        2015        K        1991        24
2        2017        K        1991        26
2        2018        K        1991        27
2        2019        K        1991        28
2        2016        K        1991        25
4        2016        C27        1991        25
4        2018        C27        1991        27
4        2019        C27        1991        28
4        2020        I        1991        29
4        2015        C27        1991        24
4        2017        C27        1991        26
5        2016        N        1990        26
5        2017        N        1990        27
5        2020        N        1990        30
5        2015        K        1990        25
5        2019        N        1990        29
5        2018        N        1990        28
6        2019        K        1992        27
6        2016        K        1992        24
6        2020        K        1992        28
6        2017        K        1992        25
6        2015        K        1992        23
6        2018        K        1992        26
7        2017        K        1992        25
7        2020        K        1992        28
7        2018        K        1992        26
7        2016        H        1992        24
7        2019        K        1992        27
7        2015        H        1992        23
8        2018        C37        1992        26
8        2017        C37        1992        25
8        2015        C37        1992        23
8        2016        C37        1992        24
8        2020        C37        1992        28
8        2019        C37        1992        27
9        2019        S        1991        28
9        2016        S        1991        25
9        2015        S        1991        24
9        2017        S        1991        26
9        2018        S        1991        27
9        2020        S        1991        29
10        2015        E        1995        20
10        2020        E        1995        25
10        2016        E        1995        21
10        2017        E        1995        22
10        2019        E        1995        24
10        2018        E        1995        23
11        2015        K        1992        23
11        2018        K        1992        26
11        2016        K        1992        24
11        2019        K        1992        27
11        2017        K        1992        25
11        2020        K        1992        28
12        2020        C30        1992        28
12        2018        C30        1992        26
12        2017        C30        1992        25
12        2019        C30        1992        27
12        2016        C30        1992        24
12        2015        C30        1992        23
14        2015        K        1992        23
14        2019        K        1992        27
14        2020        K        1992        28
14        2016        K        1992        24
14        2018        K        1992        26
14        2017        K        1992        25
16        2015        C39        1992        23
16        2020        C39        1992        28
16        2016        C39        1992        24
16        2019        C39        1992        27
16        2017        C39        1992        25
16        2018        C39        1992        26
17        2016        C37        1992        24
17        2020        C37        1992        28
17        2019        C37        1992        27
17        2017        C37        1992        25
17        2018        C37        1992        26
17        2015        C37        1992        23
18        2018        E        1992        26
18        2015        C17        1992        23
18        2017        E        1992        25
18        2016        E        1992        24
18        2019        E        1992        27
19        2018        C15        1992        26
19        2019        F        1992        27
19        2016        C15        1992        24
19        2017        C15        1992        25
19        2020        F        1992        28
19        2015        C15        1992        23
20        2020        C39        1992        28
20        2017        C39        1992        25
20        2016        C39        1992        24
20        2015        C39        1992        23
20        2018        C39        1992        26
20        2019        C39        1992        27
21        2016        C39        1994        22
21        2017        C39        1994        23
21        2015        C39        1994        21
21        2020        C39        1994        26
21        2018        C39        1994        24
21        2019        C39        1994        25
22        2017        G        1993        24
22        2015        G        1993        22
22        2018        G        1993        25
22        2016        G        1993        23
23        2020        C30        1993        27
23        2019        C30        1993        26
23        2016        C30        1993        23
23        2018        C30        1993        25
23        2017        C30        1993        24
23        2015        C30        1993        22
24        2015        K        1993        22
25        2016        F        1993        23
25        2018        F        1993        25
25        2015        F        1993        22
25        2017        F        1993        24
25        2019        F        1993        26
25        2020        F        1993        27
26        2020        F        1993        27
26        2019        F        1993        26
26        2016        F        1993        23
26        2015        F        1993        22
26        2018        F        1993        25
26        2017        F        1993        24
27        2019        D        1993        26
27        2016        D        1993        23
27        2020        D        1993        27
27        2015        D        1993        22
27        2018        D        1993        25
27        2017        D        1993        24
28        2017        F        1993        24
28        2019        F        1993        26
28        2018        F        1993        25
28        2015        F        1993        22
28        2020        F        1993        27
28        2016        F        1993        23
29        2015        K        1993        22
29        2019        K        1993        26
29        2018        K        1993        25
29        2016        K        1993        23
29        2017        K        1993        24
29        2020        K        1993        27
30        2020        C36        1993        27

7
黃河泉 在职认证  发表于 2021-12-17 12:06:29
曹越越越越越 发表于 2021-12-16 17:35
请教您一个问题,打扰啦,如何保留每一年度每一行业前百分之三十的age的数据,以及每一年度每一行业后百分 ...
你的问题我已经在另一个帖子回答了,但你的资料应该不是 dataex 格式,所以我无法直接用。

8
曹越越越越越 发表于 2021-12-17 21:02:33
黃河泉 发表于 2021-12-17 12:06
你的问题我已经在另一个帖子回答了,但你的资料应该不是 dataex 格式,所以我无法直接用。
好的谢谢您

9
赵安豆 发表于 2024-6-26 23:02:07
在Stata中,要选取一个变量的前20%(即最高或最低值),你可以使用以下步骤:

1. **排序**:首先,你需要按照你感兴趣的变量进行排序。假设你的变量叫做 `varname`,你可以使用以下命令:
   ```
   sort varname
   ```
   这将使得数据集按 `varname` 的升序排列。

2. **取前20%的数据点**:接下来,确定数据集中总共有多少观察值,并找出代表前20%的观察值的位置。假设你的数据集有N个观察值,则前20%大约是 N * 0.2。
   ```
   local top_20 = int(ceil(r(N) * 0.2))
   ```

3. **保留前20%**:使用 `keep` 命令来保留数据集的前20%。但是,由于Stata在排序后是按升序排列,如果你想要的是变量值最高的前20%,你需要反向排序或者在保留时计算出具体的位置。
   ```
   keep in 1/top_20'
   ```

如果你想取最高值的前20%,可以先降序排序:
```
sort, descending
local top_20 = int(ceil(r(N) * 0.2))
keep in 1/top_20'
```

或者,更简单的办法是使用 `pctile` 命令找出该变量的第80百分位数,并使用这个值作为筛选标准:
```
pctile varname_pct = varname, p(80)
egen byte high_val = cut(varname) (low / varname_pct' / high)
keep if high_val
```

这里,`varname_pct` 将是 `varname` 变量的第80百分位数。`high_val` 是一个新创建的变量,用于标记哪些观测值高于这个百分位数。

希望这些信息能够帮助你解决问题!如果有任何疑问或需要进一步解释,请随时提问。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 05:55