楼主: 我是小趴菜
550 1

[数据挖掘新闻] 建立线性回归模型的步骤 [推广有奖]

  • 0关注
  • 4粉丝

教授

35%

还不是VIP/贵宾

-

威望
0
论坛币
29650 个
通用积分
380.5350
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
7150 点
帖子
670
精华
0
在线时间
37 小时
注册时间
2022-8-30
最后登录
2023-4-4

楼主
我是小趴菜 发表于 2022-11-2 13:52:21 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  • 1明确需求

  • 2采集数据

  • 3数据清洗: a.重复值的处理 b.缺失值的处理 c.异常值的处理 d.数据编码的处理

    其中缺失值的处理可以用均值或众数等描述数据集中趋势的进行填补,异常值中的错误值直接手动删除,离群值的 处理要具体看业务(通常通过画箱线图,或者3西格玛法则判断),数据编码的处理,对于男女这种二分类变量可以用 0和1转化,最好的是在此基础上加上交叉列(改斜率),多分类变量如学历这种,可以采用独热编码或哑变量转换,其 中的某列得删除,避免和线性回归模型中的常量在矩阵化时有相关性

  • 4变量的筛选:查看X与Y的相关系数,查看散点图

  • 5分割测试集训练集(做预测)

  • 6回归建模(F检验,T检验,调整R^2)

  • 7模型调优

  • 8模型精修(交叉项,高次项,季节趋势)

  • 9逐步回归

  • 10模型测试





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:线性回归模型 线性回归 回归模型 二分类变量 分类变量

沙发
三江鸿 发表于 2022-11-2 15:53:29 来自手机
点个赞加点人气
感谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-8 09:22