楼主: ajiao4310
5846 21

[问答] 求帮忙指点评价多项逻辑分析的结果 [推广有奖]

  • 0关注
  • 1粉丝

已卖:24份资源

硕士生

66%

还不是VIP/贵宾

-

威望
0
论坛币
29 个
通用积分
6.8336
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5166 点
帖子
92
精华
0
在线时间
114 小时
注册时间
2013-10-14
最后登录
2023-6-7

楼主
ajiao4310 发表于 2015-7-15 08:26:58 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
新手又来向各位前辈指教了,望能够得到大家的批评和建议~~

本人研究的主要目的是建立城市用地转换的预测模型,共有四类因变量和13类自变量,其中自变量都是连续的测量数值,但是为了计算简便,本人自己将所有数据依据经验划分为了递增的等级数据,分别用1-10之间的数字来代表他们参与模型计算~~这是前提

然后,在逻辑回归分析的准备阶段,考虑到自变量都是有序递增的,我将所有的自变量都设置为协变量类型,最终分析结果如下

1.JPG

2.JPG
3-1.JPG
3-2.JPG
4.JPG


我的问题是:
1. 我的自变量处理方法是否恰当??选择协变量类型是否合适?
2. 结果中的哪些数据能判断我的模型构建是否与真实数据相符?模型预测准确度是否良好?
3.如果模型是正确的,那么B是否就代表了自变量在公式中的系数?而且没有通过显著性检验的参数是否没有必要再纳入公式计算了呢?
4. 如果处于显著性检验标准附近的参数(0.05),该如何取舍?

谢谢各位指导~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:求帮忙 变量类型 模型构建 逻辑回归 我的问题 回归分析 因变量 自变量 测量 模型

回帖推荐

xddlovejiao1314 发表于15楼  查看完整内容

第二个问题,类别变量纳入模型均处理为虚拟变量的形式。不要直接纳入模型。举个简单例子说明,就比如说你说的坡度,0-25为1,25-50为2,50-75为3,表明上看似,组与组差距是相等的(都相差25),但实际是不一样的,如有3个个体,一个1度,一个49度,一个60度,如果简要划分,分别在1,2,3组。你能简单说这3个坡度相差等级是一样的吗。不能吧。所以处理为虚拟变量,设置一组参照组。然后用虚拟变量和处理后的连续变量去构建模型。祝好 ...

沙发
xddlovejiao1314 学生认证  发表于 2015-7-15 09:10:59
第一个问题:不明白自变量明明是连续性的变量,楼主为什么要把它处理为类别变量,这背后有什么文献/理论上的依据么?即使楼主有依据这样做了,那在后面的建模分析中应该将类别变量处理为哑变量(虚拟变量)的形式纳入模型,而不是以类别变量直接纳入模型,这样会出问题的。所以建议楼主还是用连续性的变量直接纳入模型吧。PS:在建模前对数据做一些预处理,如右偏态分布数据取对数等。
已有 1 人评分论坛币 收起 理由
admin_kefu + 50 热心帮助其他会员

总评分: 论坛币 + 50   查看全部评分

藤椅
xddlovejiao1314 学生认证  发表于 2015-7-15 09:13:05
第二个问题:其实楼主想问的是模型的拟合效果(即像多元回归里面一样有个R^2)。然而logit模型不像多元线性回归,会有一个R^2,logit模型会报告一个准R^2(Pseudo R^2),但这个只能做一个参考,没有多大实际意义;判断拟合优度的另外一个方法是看正确预测的百分比,因为Logit是个概率模型。

板凳
xddlovejiao1314 学生认证  发表于 2015-7-15 09:18:01
第三个问题:B是代表自变量对应的偏回归系数。至于你说的“没有通过显著性检验的参数是否没有必要再纳入公式计算了呢?”这个问题有意思。我想楼主没有明白一个问题,就是你的自变量选取可能是你自己根据常识/一些文献来的,没有找到变量背后选择的理论基础/研究框架。如果是这样,根据我们的常识,要做一个因变量的影响因素分析,我可以根据常识选择10个,20个,甚至更多的变量,其实这没多大意思。你看真正严格做的好的文章都是基于一定的理论基础/研究框架选取的指标,有时可能就那么几个指标。而且人家还做了研究假设的。所以回到你这个问题。指标选取要基于一定理论基础/研究框架,然后做出相应的研究假设,最后构建模型证实或证伪。这时,不显著的变量要考虑从专业层面去思考为什么不显著,而不像你这样根据常识选一些指标,不显著我就不要了。

报纸
xddlovejiao1314 学生认证  发表于 2015-7-15 09:21:53
第4个问题:你可以选取3个显著性水准(即0.1,0.05和0.01)作为你的显著性水准关卡。这样可能就更好取舍一些。其实通常在0.1这个最高标准附近的变量的显著性都不是那么太关注了(如0.099和0.101我认为没太大差别),因为这个时候相比于其它显著性更强的变量,此类变量对应的偏回归系数一般都比较小了(显著性通过t值和临界值比较,t=偏回归系数/标准误)。换算回去对因变量的作用不大。

地板
chonghuihedong 发表于 2015-7-15 09:40:27
进来学习!

7
ajiao4310 发表于 2015-7-15 09:49:52
xddlovejiao1314 发表于 2015-7-15 09:13
第二个问题:其实楼主想问的是模型的拟合效果(即像多元回归里面一样有个R^2)。然而logit模型不像多元线性 ...
谢谢大神指点~~由于没接触过统计学,一些名词和概念不熟悉,还有待我进一步研究你的回复内容哈~~
不过,还有个小问题,既然你说正确预测的百分比是判断模型一个重要因素,那么我这个模型准确率在88%左右,是不是就可以说比较好呢?如果模型准确率在百分之六十多,又算是怎么一个水平呢??有没有具体判断的标准??

8
xddlovejiao1314 学生认证  发表于 2015-7-15 10:47:57
ajiao4310 发表于 2015-7-15 09:49
谢谢大神指点~~由于没接触过统计学,一些名词和概念不熟悉,还有待我进一步研究你的回复内容哈~~[em1 ...
归根结底这一切都是看拟合优度,然而拟合优度的判断也是比较主观的。不同的模型之间比较,你不能因为一个R^2大点就说这个模型一定好。同理,预测正确率这个也是一个辅助判断标准,没有太多特别的意义。当然越大越好,你这个88%已经非常不错了。我发的一些文章能有60%多就不错。总之一句话,不要太迷恋于R^2和预测正确率这些东西,在写作的时候简要交代下就行。祝好运。有问题可以@我(xddlovejiao1314)

9
ajiao4310 发表于 2015-7-15 14:16:37 来自手机
xddlovejiao1314 发表于 2015-7-15 10:47
归根结底这一切都是看拟合优度,然而拟合优度的判断也是比较主观的。不同的模型之间比较,你不能因为一个 ...
真的非常感谢,等会我再仔细研究下你前面的回复,有问题再来请教你!

10
didamunaoke 发表于 2015-7-15 18:46:11
xddlovejiao1314 发表于 2015-7-15 09:18
第三个问题:B是代表自变量对应的偏回归系数。至于你说的“没有通过显著性检验的参数是否没有必要再纳入公式 ...
解释的好详细 学习了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 02:14