楼主: xiaoshijie_28
2033 5

[作业] 自变量为二分类和数值变量,因变量为数值,何种模型适合数据预测分析 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

小学生

64%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
36 点
帖子
4
精华
0
在线时间
9 小时
注册时间
2019-2-18
最后登录
2019-5-10

5论坛币
最近在研究数据挖掘,遇到实际问题,预测水量数据,自变量中有年月(时序),水表数(数值),用水分类(已处理成二分类),地区(已处理成二分类),因变量为用水量。
已经建立了多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定,超过20%误差。
请问大神们,哪些模型可以处理。或者说,我还需要做什么预处理吗。
我用的是Python直接代码的。

最佳答案

eeabcde 查看完整内容

"多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定",是不是多项式的次数取得太高产生过拟合了?
关键词:数据预测 预测分析 数值变量 自变量 二分类 数据挖掘
沙发
eeabcde 发表于 2019-2-18 09:28:47 |只看作者 |坛友微信交流群
"多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定",是不是多项式的次数取得太高产生过拟合了?

使用道具

藤椅
xiaoshijie_28 发表于 2019-2-20 15:51:12 |只看作者 |坛友微信交流群
eeabcde 发表于 2019-2-20 15:22
"多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定",是不是多项式的次数取得太高产生过拟合了 ...
我的拟合度在2-4次这三个里面,都维持在.95以上,拟合度都是很好的,然后预测出来的值,平均误差在5%左右,但是个别预测不理想的,误差就很高。应该是存在过拟合的情况,我用2次还存在过拟合的话,那用多项式不就没意义了吗

使用道具

板凳
阿扁V5 学生认证  发表于 2019-2-21 13:02:34 |只看作者 |坛友微信交流群
时间序列模型可以看看

使用道具

报纸
xiaoshijie_28 发表于 2019-2-25 09:00:57 |只看作者 |坛友微信交流群
阿扁V5 发表于 2019-2-21 13:02
时间序列模型可以看看
时间序列中,如何加入其他变量

使用道具

地板
regat 发表于 2019-2-26 14:16:39 |只看作者 |坛友微信交流群
时间序列ARIMA模型

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 12:25