楼主: Catus
17237 9

[数据管理求助] bootstrap的结果一定和以前的不一样吗? [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

初中生

19%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
58 点
帖子
8
精华
0
在线时间
14 小时
注册时间
2014-10-28
最后登录
2015-10-22

楼主
Catus 发表于 2015-10-4 17:39:58 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教高手和前辈:

bootstrap的结果一定和以前的不一样吗?

我的难题是,我的sample有344个,但并非正态分布,我先在假设正态分布的基础上算了mean和95%CI;然后bootstrap,两种方法得到的结果基本是一样的,除了置信区间有些许差别。

我不明白的是,我的数据明显不是正态分布,建立在正态分布基础上的假设便是不准确的,拔靴法结果应该是准确的,为何两次是一样呢?

我的command:

bootstrap meancost =r(mean),reps(1000) : sum cost
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Bootstrap Bootstra boots boot Trap 正态分布 置信区间 command

沙发
Catus 发表于 2015-10-4 17:50:25
补充一点:我的sample是一个,里面含有344个个体。

二:我每次bootstrap的结果是一样的,不管怎么改seed和reps, 我怀疑stata是不是直接把我的原sample重复了好几遍。

三:我的目的是计算平均消费,sample数据中含有大量的0,不知是否有影响。。

多谢了!!

藤椅
foozhencheng 学生认证  发表于 2015-10-4 18:32:52 来自手机
给数据吧~窝自己跑一遍试试就知道了~

板凳
蓝色 发表于 2015-10-4 18:45:45
你看人家的提示啊,同时,bs方法不是计算均值的,是通过抽样计算标准误的。

Warning:  Because summarize is not an estimation command or does not set e(sample), bootstrap has no way to determine
          which observations are used in calculating the statistics and so assumes that all observations are used.  This
          means that no observations will be excluded from the resampling because of missing values or other reasons.


报纸
Catus 发表于 2015-10-5 06:57:23
蓝色 发表于 2015-10-4 18:45
你看人家的提示啊,   每次都全部抽样当然结果是一样的

Warning:  Because summarize is not an estimat ...
我好像知道问题在哪儿了,看来我的怀疑是正确的,的确没有抽样,而只是在重复使用我的原sample。多谢你的提点!!

请问,我要怎么bootstrap mean呢?在网上找到的例子都是regression的,我想的到的是mean of mean

地板
Catus 发表于 2015-10-5 07:01:40
foozhencheng 发表于 2015-10-4 18:32
给数据吧~窝自己跑一遍试试就知道了~
好的,麻烦你帮我看一下,谢谢!
我纠结的是怎么bootstrap mean of mean.

7
蓝色 发表于 2015-10-5 08:41:27
Catus 发表于 2015-10-5 06:57
我好像知道问题在哪儿了,看来我的怀疑是正确的,的确没有抽样,而只是在重复使用我的原sample。多谢你的 ...
bs是为了估计标准误或者置信区间的
不是为了算均值(你也可以看bootstrap的帮助里面有save选项,把每次的结果保存出来,单独计算n次抽样的均值)

你看用STATA做微观计量经济学A.科林·卡梅伦 的第13章 自抽样法(论坛上有英文的Microeconometrics Using Stata
或者《应用stata做统计分析》的第14章有介绍

8
Catus 发表于 2015-10-5 17:00:21
蓝色 发表于 2015-10-5 08:41
bs是为了估计标准误或者置信区间的
不是为了算均值(你也可以看bootstrap的帮助里面有save选项,把每次的 ...
非常感谢,我知道了。看来我的方法本身就是错误的,我再试试!

9
foozhencheng 学生认证  发表于 2015-10-6 16:22:27
Catus 发表于 2015-10-5 17:00
非常感谢,我知道了。看来我的方法本身就是错误的,我再试试!
bootstrap每次resample的mean也是可以不一样的,所以bootstrap可以给出mean的分布,但是如果你真的无限次resample得到了mean的“真实”分布,那么这个分布的平均值是一定会等于sample mean的。原因是bootstrap的时候每个data都是等几率取的。但是bootstrap的好处就是你可以估计出mean的置信限,这一点是MLE做不到的~

10
湘茜红 发表于 2015-10-6 19:43:27
设种子值

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-4 09:47