关于sampling的问题的一个SAS程序实现-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 软件培训>>

SAS软件培训

>>

关于sampling的问题的一个SAS程序实现

关于sampling的问题的一个SAS程序实现

发布:tangliang0905 | 分类:SAS软件培训

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

获取电子版《CDA一级教材》

完整电子版已上线CDA网校,累计已有10万+在读~ 教材严格按考试大纲编写,适合CDA考生备考,也适合业务及数据分析岗位的从业者提升自我。

完整电子版已上线CDA网校,累计已有10万+在读~ 教材严格按考试大纲编写,适合CDA考生备考,也适合业务及数据分析岗位的从业者提升自我。

最近在做一个关于sampling的项目,有一个问题很有趣,想跟大家讨论一下。这个data有37747个关于付款的数据,现在已经按照大小排序好,最少付款额是1块,最高是61125.21,现在想从这37747个数据里面选出600个sample在 ...
免费学术公开课,扫码加入


最近在做一个关于sampling的项目,有一个问题很有趣,想跟大家讨论一下。
这个data有37747个关于付款的数据,现在已经按照大小排序好,最少付款额是1块,最高是61125.21,现在想从这37747个数据里面选出600个sample在付款额上代表整个数据。一种想法是因为这些钱数都比较分散,并不是平均分布的,所以用SRS的方法不太合理。所以想到既然是要对钱数做sample,那就索性做10个strata,每一个strata里面包含10%的total payment,这样的话,落在0-10%的数据最多,然后10%-20%里面其次,这样下去,90%-100%里面数据最少,然后按照一定比例,在每个strata里面抽取一定量的sample,最后合成600个。
我现在的想法是既然要取600个sample,那我可以直接做600个strata,这样的话,每个strata里面随机取一个数据去表征这一个strata,然后把这600个sample合并起来。但是实际操作中发现,因为数据是付款大小排列,最高的金额61125.21可能已经占到整个付款额的1%左右,那样第600个或者第599个strata里面只会有一个数据,那样选的话,最大的几个值一定会选中,这样就会使整个sample的有些skew to the right.
proc sql;
create table sum as
select sum(payment) as total from sorted
;
quit;
data sort1;
if _n_=1 then set sum;
set sorted;
cum+payment;
strata=ceil((cum/total)*600);
run;
有时候用这种方法都不一定能够得到600个strata,可能差了1-2个,所以我的想法就是把最后几个里面只有一个数据的strata合并成一个新的strata,然后倒着推上去,重新把剩下的数据按照付款额再分599个strata,把最后几个里面只有一个数据的strata合并成一个新的strata,然后以此从下往上类推上去,直到里面所有的strata里面都至少含有两个数据以上,然后再用SRS的方法每个strata里面取出一个数据来。
我自己试了一下,可能是我自己写程序的时候逻辑还不是很清楚,所以折腾了好半天也不行,不知道版上有没有哪位兄弟可以一起与我讨论一下,甚至提出一些更好的方法来呢?
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-2683909-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
数据分析师 人大经济论坛 大学 专业 手机版
联系客服
值班时间:工作日(9:00--18:00)