楼主: xujie19871115
1818 3

在不同的误差分布下各种估计方法的优劣性比较? [推广有奖]

  • 0关注
  • 0粉丝

已卖:348份资源

大专生

90%

还不是VIP/贵宾

-

威望
0
论坛币
852 个
通用积分
0.0600
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5071 点
帖子
64
精华
0
在线时间
39 小时
注册时间
2010-4-18
最后登录
2013-9-4

楼主
xujie19871115 发表于 2010-4-25 14:08:59 |AI写论文
2论坛币
在不同的误差分布下各种估计方法的优劣性比较?

请问,这个问题从哪些方面着手?????????

关键词:误差 劣性

沙发
飘洒 发表于 2010-5-1 22:09:38
你可以用一些常用的准则来比较,我觉得比较好的是5-fold crossvalidation or 10-fold crossvalidation.但这统计量计算要忙烦一些。但性能很好。也可以用generalized crossvalidation, BIC.
对小样本的话也可以用AIC.
(仅供参考)
It is not entirely satisfying but the alternatives are worse!
统计人

藤椅
alphastatist 发表于 2010-5-3 17:16:16
模拟方法也可考虑
http://www.pinggu.org/bbs/images/logo2.gif[/IMG][/URL]

板凳
snakepointid 发表于 2015-7-3 11:37:38
首先,一切都要从业务出发或者理论出发!!!
数据分析本身并没有发现一切规律的能力。数据分析最好的用途就是对已有的理论或者你熟悉的业务逻辑进行实证的,数据支持的分析。所以在选模型的时候,一定要充分了解你要研究的问题。
在那个基础上,对模型的判别有很多判断准则比如AIC,BIC等等,但是一定要记住那些都不能作为你模型判断的绝对标准。你的模型必须符合逻辑和常识。

不过残差或者误差确实能帮我们提供很多信息。如果残差是整体分布,那么首先考虑线性回归。如果是泊松分布,首先考虑对数回归模型。如果是二分类问题,首先考虑逻辑回归。
如果你要研究的问题确实没有太多理论支撑以及你的数据量够的话,并且你只在乎用模型来进行预测,那么你可以用一些现代的方法如随机森林,神经网络等等。现代的方法的选择一般通过CV交叉验证的方法来选取。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 05:13