楼主: 大头的脑袋
4256 5

[问答] R语言中如何的在线性和非线性模型中挑选最优模型(线性、指数、幂、对数、二次多项式 [推广有奖]

  • 1关注
  • 0粉丝

大专生

5%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
712 点
帖子
5
精华
0
在线时间
84 小时
注册时间
2017-3-2
最后登录
2025-3-28

楼主
大头的脑袋 学生认证  发表于 2017-9-3 09:54:19 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位老师大家好,最近在用R语言做一元线性和非线性回归模型拟合(线性、指数、幂、对数、二次多项式)。其中指数、幂和对数分别对自变量或因变量进行对数转换,然后对转换后的量进行线性拟合即可。发现,这样做得到的5种模型的R2和RMSE并不符合预期,反而有些模型R2最大,而RMSE也最大。对此,在下查阅一些资料(http://blog.minitab.com/blog/adv ... onlinear-regression)发现有些人认为非线性拟合的决定系数被称作伪决定系数,线性模型的R2才是真实可靠的R2.
所以想请教各位老师几个问题:1,经过对自变量或者因变量转换再进行线性拟合得到的R2不可以代表未转换前的非线性方程的R2,对吗?
2,如果1中所说是对的,那么如果利用AIC的值来判定五种模型中哪个最优是可行的吗?转换后方程求得的AIC值是否可以代表未转换前非线性方程的AIC?
3,通过计算其他如误差平方和、偏差等可以共同判定哪个是最有的模型,可是经过计算发现有些指标的大小并不是一一对应,即较小的误差平方和意味着较好的拟合精度,但同时对应着较大的偏差或者平均绝对误差。想请问在不同指标给出的最优模型相左时,应该怎么判定最优模型?
不知道说明白没有,欢迎大家交流讨论,谢谢大家
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
z644070039 发表于 2017-9-3 11:15:36
不知道你把因变量都作了变化之后,再计算R方有何意义
AIC的原理是最大似然函数

藤椅
大头的脑袋 学生认证  发表于 2017-9-3 11:24:59
z644070039 发表于 2017-9-3 11:15
不知道你把因变量都作了变化之后,再计算R方有何意义
AIC的原理是最大似然函数
我的目的只是想比较这5种模型的拟合精度,然后挑选初最优的模型。不知道该比较哪些指标,或者以哪些指标为主?

板凳
z644070039 发表于 2017-9-3 16:07:51
大头的脑袋 发表于 2017-9-3 11:24
我的目的只是想比较这5种模型的拟合精度,然后挑选初最优的模型。不知道该比较哪些指标,或者以哪些指标为 ...
一般而言,AIC/BIC这类信息指标比R方更好.

报纸
大头的脑袋 学生认证  发表于 2017-9-3 19:53:41
z644070039 发表于 2017-9-3 16:07
一般而言,AIC/BIC这类信息指标比R方更好.
感谢您的回复。只是在比较五种模型时我将数据分成了验证数据集和训练数据集,建模时只使用训练数据集,然后用验证数据集验证。向AIC/BIC等只是比较构建的模型的优劣,并不涉及验证数据集,所以有什么其他指标推荐的吗?

地板
z644070039 发表于 2017-9-3 23:41:48
大头的脑袋 发表于 2017-9-3 19:53
感谢您的回复。只是在比较五种模型时我将数据分成了验证数据集和训练数据集,建模时只使用训练数据集,然 ...
你指的回测啊,这个就有点复杂了,要根据你具体研究的问题来分析的。(另外我不是搞量投那方向的)

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-21 11:22