楼主: ChenJY26
2168 4

[数据挖掘理论与案例] 大部分变量存在多重共线性问题如何解决 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

50%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
46.1123
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
4331 点
帖子
74
精华
0
在线时间
82 小时
注册时间
2022-5-12
最后登录
2024-4-22

楼主
ChenJY26 学生认证  发表于 2022-5-12 14:39:57 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近和同学在做关于农业方向的产量预测,由于专业原因没有用ARCGIS(应该是这个软件吧)的遥感数据,而是选取从业人员、耕地面积、农药使用等分析。但线性拟合变量存在共线性,逐步回归结果也不太好,在想是一开始数据变量选择上出了问题还是方法出了问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多重共线性问题 多重共线性 多重共线 共线性 性问题

沙发
南南数据 发表于 2022-5-13 12:14:02
对解释变量进行主成分分析,再用主成分进行回归分析。

藤椅
etoy 发表于 2022-5-14 09:26:01
比如,根据相关系数解决,采取或考虑将一些相关的自变量从模型中剔除。有选择的确定模型中的自变量

板凳
llb_321 在职认证  发表于 2022-5-15 08:44:48
1、农业产量直接对应土地面积,而土地面积都有大致类似水平的劳动力投入、种子化肥农药投入,所以从您的变量选择上看,部分变量共线是正常的。
2、您的变量不够,建议采集土地面积、土地级别、化肥投入、农药投入、种子投入、农机及燃油投入、灌溉设施投入、自雇劳动力人数、外雇劳动力人数、作物类型、耕种季节、土地补贴、作物补贴、产品收购价格、灾害分级等更多、更细化的数据,最好是连续几年的数据。
3、如果数据足够,可以用面板分析。如果没有多年多数,可以用最简单的广义线性回归,如果考察农业生产技术水平,可以用数据包络分析。

共线性不怕,关键是模型是否合理、是否有现实意义。

报纸
ChenJY26 学生认证  发表于 2022-5-16 11:20:24
谢谢大家的指导,我再和同学去讨论一下!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 10:17