楼主: tangliang0905
1564 3

[问答] 怎样比较sample和原数据? [推广有奖]

  • 1关注
  • 3粉丝

讲师

52%

还不是VIP/贵宾

-

威望
0
论坛币
1137 个
通用积分
0.5583
学术水平
13 点
热心指数
20 点
信用等级
11 点
经验
30311 点
帖子
212
精华
0
在线时间
836 小时
注册时间
2012-11-29
最后登录
2024-7-23

楼主
tangliang0905 发表于 2013-7-31 12:43:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近碰到一个sampling的问题,用的是SRS方法,直接从500个原始数据里面选出50个数据出来,我的初步构想就是比较sample(其实就是原始数据的一个subset)和原始数据的mean啊,median啊,kernel啊什么的。如果有图的话,可以比较一下historgram和density。但是我发现所有overlay historgram和density的话,都是对同一数据,有没有对不同数据(sample是原始数据的subset)画图进行overlay啊,而且最后就算图像上能够显示出来的话,这两个图像的相似度也是相当主观的,有什么别的比较客观的因素去判定sample比较好的表达原始数据了呢?想和大家讨论一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Sample AMPL amp MPL PLE median 而且

沙发
tj0412ymy 发表于 2013-7-31 17:39:36
如果想保证样本分布和原数据分布尽量保持一致,可以采取局部随机抽样的方法,比如:你可以将500个原数据的分布切割成50份,然后在每一个区间内随机抽取一个数,共抽50个数构成你想要的样本。
对SAS和统计方面感兴趣的朋友,请加SAS学习和认证讨论群:169157207。欢迎在群上讨论!

藤椅
tangliang0905 发表于 2013-8-1 01:16:33
谢谢,这是一个很好的idea。我想除了客观上比较他们的mean啊,median啊,kernel啊在数值上比较接近的话,有没有什么直观的方法,从图像上比较呢?

板凳
tj0412ymy 发表于 2013-8-1 15:58:09
不论是从统计量来看还是从图像上看,都是比较直观的判断。你可以进行N次抽样,然后从中选取一个与原数据误差较小的样本作为你的分析样本。
对SAS和统计方面感兴趣的朋友,请加SAS学习和认证讨论群:169157207。欢迎在群上讨论!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 08:41