楼主: zhengjian614
2715 4

[学员答疑区] 求助,有放回抽样问题 [推广有奖]

  • 2关注
  • 0粉丝

硕士生

72%

还不是VIP/贵宾

-

威望
0
论坛币
50 个
通用积分
37.8119
学术水平
2 点
热心指数
2 点
信用等级
2 点
经验
318 点
帖子
68
精华
0
在线时间
194 小时
注册时间
2009-8-31
最后登录
2024-4-18

楼主
zhengjian614 发表于 2016-1-23 12:02:38 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有放回的对观测量为N的数据集A抽N次,为什么最后抽出来的样本数据集B的样本量是A的63%?1-(1-N)^N只是说明每个观测进入数据集B的概率为63%吧,有点想不通了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:样本数据 数据集 样本数 样本量 想不通 样本

沙发
TimeT 发表于 2016-1-23 13:04:05
我的证明的思路是:

首先,A集合中每个元素设为a(1), a(2), ..., a(i), ..., a(N),任一a(i)没有被抽中进入B集合的概率是:(1-1/N)^N,当N足够大时,此概率就趋近于exp(-1)=0.367879..., 也是说任一a(i)被抽中进入B的概率=1-0.367879=63.2121% (就是你所说的“只是说明每个观测进入数据集B的概率为63%”,但是,不只是这个结论,继续往下看)

第二,构造一组独立同分布(贝努利分布)的随机变量x(1), ...x(i),..., x(N)。而每个x(i)的定义是:若a(i)被抽中进入B集合,则x(i)=1;否则x(i)=0。由于a(i)被抽中进入B的概率是63.2121%,即,每个x(i)~Bernoulli(63.2121%)。

再构造一随机变量S,令S=x(1)+x(2)+...+x(N),不难发现,S正好就是B集合中包含多少个A中元素的数量(因为被抽中进入B集合的A中元素,不管被抽中多少次,在S中仅计入一个1,没被抽中进入B集合的A中元素,在S中计入一个0,那么S正好就是B集合中包含多少个A中元素的数量)。由于S是N个独立同分布的贝努利分布变量之和,就是符合了二项分布,即 S~Binomial(N, 63.2121%)。所以,S的期望(即B集合中包含多少个A中元素的数量的平均值)=N×63.2121%

我水平有限,欢迎批评指正。
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
子鹿 + 1 精彩帖子
zhengjian614 + 5 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 2  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
zhengjian614 发表于 2016-1-23 20:10:58
TimeT 发表于 2016-1-23 13:04
我的证明的思路是:

首先,A集合中每个元素设为a(1), a(2), ..., a(i), ..., a(N),任一a(i)没有被抽中进 ...
cool!很清晰的逻辑,表达的也到位,多谢用心了!

板凳
匿名网友  发表于 2016-4-14 23:58:14
TimeT 发表于 2016-1-23 13:04
我的证明的思路是:

首先,A集合中每个元素设为a(1), a(2), ..., a(i), ..., a(N),任一a(i)没有被抽中进 ...
X之间是相互独立的吗,P(x[1]=1,x[2]=1])=p(x[1]=1)*p(x[2]=1)?

报纸
匿名网友  发表于 2016-4-15 00:13:07
游客 123.138.217.x 发表于 2016-4-14 23:58
X之间是相互独立的吗,P(x[1]=1,x[2]=1])=p(x[1]=1)*p(x[2]=1)?
虽然假设x之间相互独立,但是X和A是有直接关系的,A之间显然不是相互独立的

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 14:11