楼主: xiaoshijie_28
6488 1

[作业] 自变量为二分类和数值变量,因变量为数值,何种模型适合数据预测分析 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

小学生

64%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
36 点
帖子
4
精华
0
在线时间
9 小时
注册时间
2019-2-18
最后登录
2019-5-10

5论坛币
最近在研究数据挖掘,遇到实际问题,预测水量数据,自变量中有年月(时序),水表数(数值),用水分类(已处理成二分类),地区(已处理成二分类),因变量为用水量。
已经建立了多项式回归的模型,拟合度一直都很高,但是实际预测误差不稳定,超过20%误差。
请问大神们,哪些模型可以处理。或者说,我还需要做什么预处理吗。
我用的是Python直接代码的。

最佳答案

dreamhappy2012 查看完整内容

在多元线性回归模型中,自变量如果有多个且都是二分类的,直接纳入即可。如果自变量中有多类别变量,那么要处理为虚拟变量再纳入模型。如果只有一个二分类自变量,那么做t检验与做一元线性回归是一样的道理。
关键词:数据预测 预测分析 数值变量 自变量 二分类
沙发
dreamhappy2012 发表于 2019-2-18 09:13:38 |只看作者 |坛友微信交流群
在多元线性回归模型中,自变量如果有多个且都是二分类的,直接纳入即可。如果自变量中有多类别变量,那么要处理为虚拟变量再纳入模型。如果只有一个二分类自变量,那么做t检验与做一元线性回归是一样的道理。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 11:41