大家来聊一聊,“过拟合现象”的根本原因是什么吧?-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 期刊>>

期刊库

>>

大家来聊一聊,“过拟合现象”的根本原因是什么吧?

大家来聊一聊,“过拟合现象”的根本原因是什么吧?

发布:财经节析 | 分类:期刊库

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

获取电子版《CDA一级教材》

完整电子版已上线CDA网校,累计已有10万+在读~ 教材严格按考试大纲编写,适合CDA考生备考,也适合业务及数据分析岗位的从业者提升自我。

完整电子版已上线CDA网校,累计已有10万+在读~ 教材严格按考试大纲编写,适合CDA考生备考,也适合业务及数据分析岗位的从业者提升自我。

大家来聊一聊,“过拟合现象”的根本原因是什么?刚才不小心发到Stata专栏里去了,又无法撤销我先谈谈我自己的一点愚见,希望能起到抛砖引玉的作用。最近在录像时,其间涉及到某一问题可能出现过拟合现象时,突然脑海 ...
免费学术公开课,扫码加入


大家来聊一聊,“过拟合现象”的根本原因是什么?
刚才不小心发到Stata专栏里去了,又无法撤销
我先谈谈我自己的一点愚见,希望能起到抛砖引玉的作用。
最近在录像时,其间涉及到某一问题可能出现过拟合现象时,突然脑海里一闪:“过拟合现象不就是样本对总体不具代表性(即代表性没那么强)所致吗?”
试想,某人得到一批样本(例如,可能是随机抽样得到的,也可能不是),如果该样本对总体不具代表性,而其所构建的模型却对该样本拟合的特别好,甚至将只有该样本具有的某些微小特征而除此之外的其他样本都不具有的特征,都刻画出来了,此时,若采用该模型去刻画其他样本,模型的拟合效果可能会很糟糕,这就是过拟合现象。因此,对于这种情形,模型的拟合程度越高,就越容易出现过拟合现象。这也就是许多教材或文献里所说的拟合优度(包括修正的拟合优度)不宜过高,如0.9999之类的,其实,是隐含了一个前提假设:当样本对总体的代表性不高时。
相反,如果样本对总体的代表性极高,一个极端情况是100%代表总体,此时,若模型对样本拟合程度的特别好,就是一件好事,如果拟合优度能达到1,就最完美了。此时,如果再重新抽样得到另一批样本,只要新样本对总体具有一定的代表性,原模型对新样本的拟合程度就不会太差;当然,如果新样本对总体的代表性不足,原模型对新样本的拟合程度不高也是正常现象,因为大家建模时,还是希望所用样本能够代表需要研究的总体,否则,通过抽样进行统计推断就失去了意义。
当然,这仅是个人的一点愚见,希望大家批评指正、交流,多提自己的看法哈
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-6609019-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
联系客服
值班时间:工作日(9:00--18:00)