楼主: anjutalq
7991 3

[实际应用] 极大似然估计参数的置信区间改如何验证? [推广有奖]

  • 0关注
  • 0粉丝

小学生

42%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
46 点
帖子
4
精华
0
在线时间
6 小时
注册时间
2013-10-16
最后登录
2013-11-5

楼主
anjutalq 发表于 2013-10-16 16:13:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1. 首先我有一个很大的样本,大约有10000个,通过matlab的dfittool工具拟合我的直方图,结果显示“t-location scale”分布最贴近我的分布。以下是拟合效果的参数:
Distribution:    t location-scale
Log likelihood:  -74.8285
Domain:          -Inf < y < Inf
Mean:            -0.00276105
Variance:        Inf

Parameter  Estimate     Std. Err.
mu         -0.00276105  0.00136255
sigma         0.108247   0.0015171
nu             1.35728   0.0253318
2.看到这个Log likehood我大胆推测dfittool工具里面对参数的估计是采用极大似然估计方法。通过matlab极大似然估计参数所常用的“mle”函数,得到的mu、sigma、nu的参数与dfittool得到的结果是一样的。
3.mle里面可设置置信区间,就是说我现在有一个大样本的参数估计和置信区间了,我如何去验证这个区间的有效性?我手上还有来自同一population的其他样本。
背景:我对这个population一无所知,我试图想用这个大样本大概获知总体的分布是什么样的,里面的参数有置信区间,但我的老师需要我去验证这个区间。
谢谢大家的关照!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:极大似然估计 置信区间 似然估计 极大似然 distribution 置信区间 如何

回帖推荐

danielruc91 发表于2楼  查看完整内容

楼主:我是学金融的,不是专业学统计的,因此以下的观点不一定代表标准的统计方法,但是可以考虑。 当你的另一个样本比较大的时候,比如10000个,可以考虑将这个外样本拆成200个子样本(每个子样本大概50个样例),对每个子样本进行一次参数估计,可以得到200个新估计值。如果你内样本的置信区间是对的,大概有10个子样本的估计值会落在原置信区间外,剩下的190个在原置信区间内(假设5%的置信水平)。这一结论的原理暂且略过,不 ...

沙发
danielruc91 在职认证  发表于 2013-10-16 19:12:45
楼主:我是学金融的,不是专业学统计的,因此以下的观点不一定代表标准的统计方法,但是可以考虑。
当你的另一个样本比较大的时候,比如10000个,可以考虑将这个外样本拆成200个子样本(每个子样本大概50个样例),对每个子样本进行一次参数估计,可以得到200个新估计值。如果你内样本的置信区间是对的,大概有10个子样本的估计值会落在原置信区间外,剩下的190个在原置信区间内(假设5%的置信水平)。这一结论的原理暂且略过,不明白可以详细问我。
当然每个子样本要30个左右是因为我们要权衡子样本大小和子样本数量。当你子样本数量太多的时候,比如1000个,每个子样本只有10个样例,由此估计出的参数可能偏差较大;当子样本数量太少的时候,比如只有10个,每个子样本含有1000个样例,参数虽然估计较为准确,但是新估计的十个参数能在多大程度上帮你确定你原来的置信区间是95%置信水平的呢?因此,50左右的子样本数是可以的选择,当然不是绝对的,也不一定是最优的。。

当然,一个逻辑问题是,为什么每个子样本包含的样例数不能太少?换一个简单的例子就是如果你有30个服从标准正态分布的相互独立样本,其实每个样例单独拿出来都可以作为总体均值的无偏、一致估计,但是,如果你把30个样例拆成30个子样本——用每个样例做一次估计,大部分新估计的参数都不会落在原有的参数区间内——和我们希望的结果不一样。

这是一个很好的问题,问题的本质在于,新估计的参数也是有置信区间的——这也就意味着,对于一个外样本而言,存在一个最优的拆分方法,而求解这一个最优拆分是需要建立一个数学模型的。因为我猜你你老师的要求应该没那么高,所以也没有细想。但是!!!考虑到你内样本有10000个那么大,这样检验的结果我也不敢保证,所以需要提醒的是,如果你的结论是拒绝原置信区间的时候,当三思。。。我们可以继续讨论。。

当你的外样本数量比较小的时候(我猜应该不是这样的),可以考虑使用bootstrap的方法。有必要可以详细讲。

藤椅
anjutalq 发表于 2013-10-16 21:18:09
danielruc91 发表于 2013-10-16 19:12
楼主:我是学金融的,不是专业学统计的,因此以下的观点不一定代表标准的统计方法,但是可以考虑。
当你的 ...
同学,你好。首先谢谢你的热心回复,对我帮助很大。我觉得我还有几个疑惑想请教你,我是工科的学生,学习的是控制理论,对一些数学问题理解还是不深的。
1.其实关于原理的问题恰恰是我最疑惑的。我想起了本科学习概率论与数理统计的时候对于置信区间的一个例子:中心极限定理告诉我们,对于一个未知分布大样本来说,样本均值服从的是一个正态分布。那么对于这个的正态分布来说,若已mu为中心,做一个90%的置信区间,那么有90%的概率,来一堆新的样本,他们的均值会落在这个区间里面。那么说到我这个例子,其实我之前做的这个大样本的拟合分布,实际上就是想“代替”理论的分布,所得到的参数是我认为的总体的真实参数(以待后面去验证它)?这道理和书本上的这个例子是一样的?
2.我所验证的t-location scale分布其实是t分布的变形,它有均值、方差、自由度三个参数。这三个参数的验证是否道理一样?是否都能通过大量的抽样,看子样本的参数是否落在之前估计的置信区间里?
3.的确如你的担忧,用来验证的这堆样本的选取的确是值得考究的问题。另一个重要的问题是:为了验证之前的参数和分布,我的验证样本必须是不同于之前的样本对吧?当然,这两个大样本都来自于同一总群。
4.bootstrap方法我刚看了其简单的介绍,似乎是用于当样本数量比较少时,有放回的抽样。不过我能肯定的是在我的例子中,我的样本数量是够用的。
最后再次谢谢你无私的帮助。谢谢你!

板凳
danielruc91 在职认证  发表于 2013-10-16 23:32:56
anjutalq 发表于 2013-10-16 21:18
同学,你好。首先谢谢你的热心回复,对我帮助很大。我觉得我还有几个疑惑想请教你,我是工科的学生,学习 ...
同学,不好意思,我好像误导你了,回复完你之后我越想越觉得奇怪,可能不是这样的。
分两步解释:
关于mle,可以参见一面这篇文章:
http://wenku.baidu.com/view/a9fac2946bec0975f465e2bf.html

文章里第一页讲了MLE的两个性质:无偏性和渐进正态性,尤其是渐进正态性是解决你的问题的关键。
渐进正态性是指,当样本量足够大的时候,极大似然估计值服从一个正态分布。由于你的样本有10000个,非常大的一个样本,所以可以很有信心地说,你的估计值的分布一定是正态的。那么由此就可以直接说出估计量的置信区间了。因此,验证这个区间实际上是一个伪命题,因为已经可以由理论指导估计量的置信区间了。


换句话说,matlab给你的置信区间在中心极限极限定理下是一定对的,不需要检验。你老师的要求怎么满足我也不知道了。。。

另一部分是,我的解释和检验方法是错的,我有点想当然了。希望没有造成太大的困扰。

关于你的疑问的回答:

1. 你的理解不太对,也是我犯错的地方。90%置信区间是指,这个分布的真实的参数落在这个区间的概率是90%。更具体的说,如果你从一个标准分布产生一组随机数(N(0,1)),并根据这组随机数估计均值的置信区间,那么这个区间包含0的概率是90%(0是真值)。。理解了吗?
matlab实验代码:
k=0;
for i=1:10000
    x=randn(1000,1); %standard normal random numbers
    mu_est=mean(x);   sigma_est=std(x);
    lower=mu_est-1.96*sigma_est;   upper=mu_est+1.96*sigma_est;
    %lower是95%置信区间下限,upper是上限,理论上这个区间包含0的概率是95%,不过你再check一下1.96这个数对不对
    if lower<0 & upper>0
         k=k+1;
    end
end


计算完成后,k的值大约为9500。希望能帮助你理解。


2. 参数置信区间是不能检验的,这是更正。


剩下的应该没什么问题了。欢迎讨论。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-8 07:01