楼主: 是昕灵哒
771 0

[程序分享] R语言检验模型是否存在过拟合 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

55%

还不是VIP/贵宾

-

威望
0
论坛币
489 个
通用积分
212.1168
学术水平
5 点
热心指数
5 点
信用等级
5 点
经验
13551 点
帖子
23
精华
0
在线时间
295 小时
注册时间
2023-4-30
最后登录
2026-2-6

楼主
是昕灵哒 发表于 2023-6-6 15:14:05 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
柯布-道格拉斯生产函数,引入时间趋势以考虑技术变化因素模型:

QQ图片20230606143224.png
下面我们来检验时间t是否是必须的变量,即模型是否存在过拟合现象。


1.做OLS回归
QQ图片20230606144654.png
从回归结果,我们可以看到时间变量t系数的p值是0.7201,在5%显著性水平下大于0.05,显著性不强,但是我们进行显著性检验的目的是来判断过度拟合假设是否成立,不能用于筛选变量。

代码:
  1. setwd("D:\\Admin\\桌面")  # 改变默认读取文件路径
  2. s <- read.table("4.2.1.csv", header = TRUE, sep=",")  # 读取数据

  3. t <- unlist(s$年份)# 时间

  4. q <- unlist(s$实际GDP指数.1978年为100.)  # 产出量

  5. k <- unlist(s$资本存量.亿元.1952年不变价.)  # 资本投入量

  6. l <- unlist(s$从业人数.万人.)  # 劳动投入量

  7. summary(lm(log(q)~log(k)+log(l)+t))  # 线性回归
复制代码
代码注意事项:
R语言中读取的数据如果不是csv文件,可以下载openxlsx包,用read.xlsx函数读取,一般建议大家用csv文件,不仅仅是因为它不需要下载包,实际应用中能少很多问题。
提取数据集某一列的时候一定要看看你提取数据后的类型,如果数据比如像”3.2.1”,它有两个小数点,会导致这一列的数据都是字符串。
R语言转换数据类型,有时候用as.vector()转换出来的数据不一定是向量数据类型。在R语言中列表list和向量vector比较混,如果你转换向量却出现了列表,用unlist()或许会帮助你解决问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:R语言 过拟合 admin 道格拉斯 过度拟合 过拟合 导入、读取数据注意事项

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-8 07:02