楼主: jglyx1
3264 3

请问,多个条件情况下,对一个数据集进行拆分,要怎么做 [推广有奖]

  • 0关注
  • 0粉丝

学前班

70%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
33 点
帖子
2
精华
0
在线时间
2 小时
注册时间
2016-2-16
最后登录
2016-2-19

楼主
jglyx1 发表于 2016-2-16 16:16:09 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我现在有一个这样的数据集,数据集中的数据可以分为30层,每层数据内相互之间存在一定差别,层与层之间差别较大。我想把整个数据集拆分成60个,需要满足的条件是,从最高层向下随机抽取,最终生成的60个小数据集总数据量一致,里面所包含的每个分层的数据量也一致,每个小数据集中其中一个字段的数值求和近似相等,分布也基本相当,且其他字段的数值做到相互之间差别不大。请问要怎么做呢?

具体上数据集大概是这个样子:

分层  字段1  字段2  字段3
A       1          2         3
A       4          5         6
A       7          8         9
B      10         11        12
B      13         14        15
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 怎么做 相互之间 小数据

沙发
jglyx1 发表于 2016-2-17 09:05:28
各位高人,可否给个建议呢

藤椅
co_fund 发表于 2016-2-17 09:32:45
请使用Proc surveyselect

板凳
tonic_zlj 发表于 2016-2-19 15:58:29
co_fund 发表于 2016-2-17 09:32
请使用Proc surveyselect
一种使用sas自带的抽样proc surveryselect,另外就是手动分组,生成随机数,按你需要的变量排序,除以60取余,得到分组编号,输出。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 01:15