楼主: vampirejessie
1295 8

[数据管理求助] 求问随机取样后怎么保留删掉的观测值? [推广有奖]

  • 0关注
  • 0粉丝

初中生

42%

还不是VIP/贵宾

-

威望
0
论坛币
978 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
75 点
帖子
8
精华
0
在线时间
16 小时
注册时间
2013-7-3
最后登录
2020-2-22

楼主
vampirejessie 发表于 2017-7-28 15:00:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一个面板数据,要依id取70%的观测值作为training data,30%的作为test data。我用 sample 70 指令的话另外30%就删去了,而且我不确定它是不是按id取样的。想请问如何保留剩下的30%;以及取样时是取的70%的id(每个id各自内部的每个观测值都保留),而不是每个id各自的观测值取70%,也不是总观测值量取了70%。谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:观测值 Training Sample Train Data

沙发
黃河泉 在职认证  发表于 2017-7-28 15:52:05
试试
  1. webuse grunfeld, clear

  2. tempfile main
  3. save "`main'"

  4. set seed 1234
  5. sample 70, by(company)
  6. gen train = 1

  7. merge 1:1 company year using "`main'"
  8. replace train = 0 if train == .
  9. sort company year
复制代码

藤椅
newbbs 在职认证  发表于 2017-7-28 16:22:12 来自手机
赞一个

板凳
vampirejessie 发表于 2017-7-28 16:42:07
明白了,谢谢!这个解决了保留删除掉的观测值的问题。不过这个是10个company里每个company用70%的年度数据;但是我想要70%的company,就是training data里只要7个company,但是每个company里的20年数据都有,求问那应该怎么做呢?感谢!

报纸
黃河泉 在职认证  发表于 2017-7-28 17:08:21
vampirejessie 发表于 2017-7-28 16:42
明白了,谢谢!这个解决了保留删除掉的观测值的问题。不过这个是10个company里每个company用70%的年度数据; ...
1. 你要按回复,我才会看到通知!2. 请试试
  1. webuse grunfeld, clear

  2. tempfile main
  3. save "`main'"

  4. gen train = 1
  5. collapse train, by(company)
  6. set seed 1234
  7. sample 70

  8. merge 1:m company using "`main'"
  9. replace train = 0 if train == .
  10. sort company year
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Sunknownay + 2 + 2 + 2 热心帮助其他会员

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

地板
vampirejessie 发表于 2017-7-29 09:34:30
黃河泉 发表于 2017-7-28 17:08
1. 你要按回复,我才会看到通知!2. 请试试
这个可以!感谢感谢!

7
vampirejessie 发表于 2017-7-29 09:44:13
黃河泉 发表于 2017-7-28 17:08
1. 你要按回复,我才会看到通知!2. 请试试
还有个相关小问题,我之前在数据处理的时候其实应该做merge 1:m,但是我做的merge m:m,这个对结果有影响么?

8
黃河泉 在职认证  发表于 2017-7-29 09:50:24
vampirejessie 发表于 2017-7-29 09:44
还有个相关小问题,我之前在数据处理的时候其实应该做merge 1:m,但是我做的merge m:m,这个对结果有影响 ...
我的良心建议,这辈子不要再用 merge m:m 了!

9
vampirejessie 发表于 2017-7-29 10:07:22
黃河泉 发表于 2017-7-29 09:50
我的良心建议,这辈子不要再用 merge m:m 了!
哈哈哈好的,那我还是改了再重新搞一遍保险。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-28 17:58