楼主: future0828
11312 11

[数据求助] 判断是否适合线性模型 [推广有奖]

  • 0关注
  • 0粉丝

大专生

80%

还不是VIP/贵宾

-

威望
0
论坛币
100 个
通用积分
1.0994
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1617 点
帖子
32
精华
0
在线时间
92 小时
注册时间
2013-8-3
最后登录
2016-6-13

楼主
future0828 发表于 2015-7-30 09:29:24 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
对于一元线性模型,很容易从散点图图形上看出是否符合线性趋势;那么对于多元自变量,怎么判断其是否符合线性模型?虽然有可能模型检验和方程系数的检验都没问题,但也可能不符合线性趋势
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:线性模型 怎么判断 模型检验 散点图 自变量 线性模型

沙发
xddlovejiao1314 学生认证  发表于 2015-7-30 09:49:09
楼主可以通过散点图,做变量间的拟合,看看数据大致是服从什么趋势(如线性、非线性)再进一步用模型验证就好。祝好运。
已有 1 人评分论坛币 收起 理由
admin_kefu + 15 热心帮助其他会员

总评分: 论坛币 + 15   查看全部评分

藤椅
future0828 发表于 2015-7-30 09:58:54
xddlovejiao1314 发表于 2015-7-30 09:49
楼主可以通过散点图,做变量间的拟合,看看数据大致是服从什么趋势(如线性、非线性)再进一步用模型验证就 ...
一个自变量通过散点图 很方便的看出大致趋势;
我想了解的是多元,比如50个自变量,怎么看这50个自变量与因变量之间的趋势?

板凳
xddlovejiao1314 学生认证  发表于 2015-7-30 10:07:27
future0828 发表于 2015-7-30 09:58
一个自变量通过散点图 很方便的看出大致趋势;
我想了解的是多元,比如50个自变量,怎么看这50个自变量与 ...
做一个散点图矩阵就实现了啊,其背后的原理其实就相当于做了50次单个自变量和因变量之间的趋势。

报纸
future0828 发表于 2015-7-30 10:10:22
xddlovejiao1314 发表于 2015-7-30 10:07
做一个散点图矩阵就实现了啊,其背后的原理其实就相当于做了50次单个自变量和因变量之间的趋势。
多谢,我计算试试

地板
future0828 发表于 2015-7-30 10:14:32
另外还有个疑问:比如我考虑网站的会员数与PV的关系,我取了近一个月的PV数,近3个月的PV数,近6个月的PV数,我做logistic回归时如何处理这三个不同时间段的PV数?

7
future0828 发表于 2015-7-30 10:29:19
xddlovejiao1314 发表于 2015-7-30 10:07
做一个散点图矩阵就实现了啊,其背后的原理其实就相当于做了50次单个自变量和因变量之间的趋势。
散点图矩阵能够实现数值型的自变量直接的趋势,如果是这50种自变量里面混杂了名义变量、数值变量,因变量是分类变量,请问该如何处理?
另外还有个疑问:比如我考虑网站的会员数与PV的关系,我取了近一个月的PV数,近3个月的PV数,近6个月的PV数,我做logistic回归时如何处理这三个不同时间段的PV数?

8
xddlovejiao1314 学生认证  发表于 2015-7-30 10:39:56
future0828 发表于 2015-7-30 10:29
另外还有个疑问:比如我考虑网站的会员数与PV的关系,我取了近一个月的PV数,近3个月的PV数,近6个月的 ...
因为6个月的PV数包含3个月的PV数,而3个月的PV数又包含1个月的PV数。数据是嵌套的,所以如果你要构建Logistic回归模型。我的建议是:要么你就只用6个月的PV数这一变量与因变量构建模型;要么你构建3个模型,即1个月的PV数与因变量构建一个模型,3个月构建一个,6个月再构建一个。

9
future0828 发表于 2015-7-30 11:04:18
xddlovejiao1314 发表于 2015-7-30 10:39
因为6个月的PV数包含3个月的PV数,而3个月的PV数又包含1个月的PV数。数据是嵌套的,所以如果你要构建Logi ...
非常感谢!
如果是这50种自变量里面混杂了名义变量、数值变量,因变量是分类变量,请问该如何处理?

10
xddlovejiao1314 学生认证  发表于 2015-7-30 11:15:42
future0828 发表于 2015-7-30 11:04
非常感谢!
如果是这50种自变量里面混杂了名义变量、数值变量,因变量是分类变量,请问该如何处理?
判定线性非线性趋势,连续性自变量你可以通过散点图来判断。类别变量就没多大必要了。直接以哑变量的形式纳入模型即可的。因变量是类别变量,貌似就不好和连续性自变量间做散点图了。其实,在这种情况下我倒觉得应该不要太担心变量间的非线性趋势,而应该更关注连续性自变量间的多重共线性诊断。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 07:12