楼主: xingshiqi
5429 5

[学科前沿] 请教一个非参数中带宽选择的问题 [推广有奖]

  • 2关注
  • 0粉丝

已卖:83份资源

博士生

28%

还不是VIP/贵宾

-

威望
0
论坛币
80 个
通用积分
1.0600
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2796 点
帖子
260
精华
0
在线时间
188 小时
注册时间
2009-6-9
最后登录
2019-8-19

楼主
xingshiqi 发表于 2011-12-9 10:24:53 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有一种选择带宽的方法叫交叉验证法(cross-validation),里面有一个缺一估计量(leave-one-out),请问为什么去掉一个观测点进行估计呢?不是很理解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:非参数 Validation Leave Cross Valid 带宽

回帖推荐

笑意苍凉 发表于4楼  查看完整内容

补充一下:如果不从数学上去推,直观的去想:cross-validation的本质仍然是让误差平方和最小,误差是观测值减去估计值。假设我们考虑local constant的情形:带宽越大,包含的X_i越多,最后的估计值Y只会是一个常数(如果kernel function是uniform的),这样误差肯定很大。相反,如果我们使得带宽h变小,那么区间内的观测值越少,距离实际值也就越接近,误差也就越小。这样的话,当h无限接近于0的时候,我们的g(x)_hat就collapse到原 ...

笑意苍凉 发表于3楼  查看完整内容

如果不去掉一个点的话,最优带宽h将会等于0,这样就违背了当n趋向无穷,nh趋近于0的假设了。这个计算起来要很多技巧,计算还是挺麻烦的~

本帖被以下文库推荐

沙发
changzhenhai 发表于 2011-12-9 17:12:50
可以看出这个点的影响

藤椅
笑意苍凉 发表于 2012-1-26 14:16:33
如果不去掉一个点的话,最优带宽h将会等于0,这样就违背了当n趋向无穷,nh趋近于0的假设了。这个计算起来要很多技巧,计算还是挺麻烦的~
已有 1 人评分经验 论坛币 收起 理由
胖胖小龟宝 + 10 + 10 热心帮助其他会员

总评分: 经验 + 10  论坛币 + 10   查看全部评分

板凳
笑意苍凉 发表于 2012-2-2 14:43:49
补充一下:如果不从数学上去推,直观的去想:cross-validation的本质仍然是让误差平方和最小,误差是观测值减去估计值。假设我们考虑local constant的情形:带宽越大,包含的X_i越多,最后的估计值Y只会是一个常数(如果kernel function是uniform的),这样误差肯定很大。相反,如果我们使得带宽h变小,那么区间内的观测值越少,距离实际值也就越接近,误差也就越小。这样的话,当h无限接近于0的时候,我们的g(x)_hat就collapse到原始的least square上了。所以当h=0时候,结果反而是最好的。这样,非参数方法岂不是没有意义了~

报纸
caoqiang06 发表于 2012-2-29 21:21:03
min CV(h)=
最小化CV,如果不去掉自己,那肯定可以选择足够小的带宽,使得x领域内的观测值只剩下yi
多做学术

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 16:22