楼主: 木鱼流沙
7678 22

求助:克服多重共线性,因变量是离散型数据 [推广有奖]

11
bingshijiang 发表于 2015-10-8 16:29:25 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-10-8 16:13
还是我上面说的话额:“至于你说的想所用单变量方差分析,这是针对因变量是连续性变量时使用的方法, ...
“单变量方差分析(多个分类变量)的结果,要看性别的差别,与只有“因变量和性别两个”做单因素方差分析,结果有何区别与联系?“

意思是:单变量方差分析(多个分类变量一起进入)的结果,会有参数估计值。这个估计值(见下表)的意义,与 多个分类变量,分别单一的用 单因素方差分析的 结果的 差别与联系。

额,我应该回去做一个 “单因素方差分析” 结果出来。

        参数           估计值         标准误差        T值           Sig.
                                       
常数项         5.390        2.718   1.983        .048
        白村        -.697                .525        -1.329        .184
        葛村        2.378        .520        4.572        .000
        焦村        2.310        .533        4.330        .000
        黎村        1.236        .467        2.647        .008
        皮村        1.967        .467        4.208        .000
        店村        2.567        .459        5.595        .000
        前村        -.498                .549        -.908         .364
        沙村        3.587        .479        7.483        .000
        窝村        1.511        .466        3.244        .001
        营村         .811          .528        1.536        .125
        吴村        3.278        .466        7.037        .000
        兰村        2.474        .537        4.603        .000
        乐村        .617          .529        1.167        .244

使用道具

12
xddlovejiao1314 学生认证  发表于 2015-10-8 16:38:27 |只看作者 |坛友微信交流群
bingshijiang 发表于 2015-10-8 16:29
“单变量方差分析(多个分类变量)的结果,要看性别的差别,与只有“因变量和性别两个”做单因素方差分析 ...
   第一,你这么做是近似的将因变量看做连续变量来处理了额。
   第二,你看你最终的目的是什么?是要比较这些村落在某个变量上差异是否显著还是怎样?如果你是将将因变量看做连续变量来处理了,想比较各个村落在因变量上的差异是否显著,这时用方差分析,勾选多重比较选项即可。
    第三,在回过来看看你这个问题。在我看来不是一回事了,比较的参照组都不一样。这样来理解,打个比方,一个是用总体样本去求均值,一个是将总体分成很多类,然后每类单独求均值。两者表达的不是同一个东西。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
zongcwei + 5 + 5 + 5 精彩帖子

总评分: 学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

使用道具

13
bingshijiang 发表于 2015-10-8 16:56:53 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-10-8 16:38
第一,你这么做是近似的将因变量看做连续变量来处理了额。
   第二,你看你最终的目的是什么?是要比 ...
1.确实是当做连续变量了。本来只是一试,因此也正在向您请教。
2.表中所列的,只是一个分类变量,我给摘出来,省的太长。其实还有其他几个分类变量,也是接在此表下面的。目的是想看各个分类自变量对因变量的影响程度(计划是看回归系数吧,这样理解容易),但最后到这一步了,也不太好理解了。
我目前对结果的理解就是 y=(if 村=村1,系数是a1,if 村=村2,系数是a2...)* X1+(if 时间=时间1,系数是b1,if 时间=时间2,系数是b2...)* X2 + ...
3.看来现在您应该理解得对了。可能是我方法本就选错。计划回去再看秩和检验。

使用道具

14
xddlovejiao1314 学生认证  发表于 2015-10-8 17:01:43 |只看作者 |坛友微信交流群
bingshijiang 发表于 2015-10-8 16:56
1.确实是当做连续变量了。本来只是一试,因此也正在向您请教。
2.表中所列的,只是一个分类变量,我给摘 ...
感觉你直接用有序多分类Logistic回归模型就解决问题了,人为的把它搞复杂了。

使用道具

15
bingshijiang 发表于 2015-10-8 17:19:06 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-10-8 17:01
感觉你直接用有序多分类Logistic回归模型就解决问题了,认为的把它搞复杂了。
当时也考虑过,只是分类太多了,不晓得可行性如何。
我刚刚又看了一遍,估计您说的可行。无非是成了个概率的概念,影响程度的量化,我也得再推敲推敲。
也罢,再一试这种方法,顺便比较下 与 但上种方法的差别。
多蒙指点,谢谢。

使用道具

16
zongcwei 发表于 2015-10-10 22:19:01 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-10-8 17:01
感觉你直接用有序多分类Logistic回归模型就解决问题了,人为的把它搞复杂了。
高手,搭车问一下,我现在利用多元线性回归分析做主观感受与客观环境各要素之间的分析,主观感受四个维度分别是因变量,自变量客观环境包括13个。虽然R2 拟合度和F检验通过了,但发现VIF超级大,有的高达66.但我不想做主成分分析,因为运转出来的主成分有限,请问还有什么办法?谢谢您!

使用道具

17
xddlovejiao1314 学生认证  发表于 2015-10-10 22:36:36 |只看作者 |坛友微信交流群
zongcwei 发表于 2015-10-10 22:19
高手,搭车问一下,我现在利用多元线性回归分析做主观感受与客观环境各要素之间的分析,主观感受四个维度 ...
逐步回归或岭回归。

使用道具

18
zongcwei 发表于 2015-10-10 22:39:51 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-10-10 22:36
逐步回归或岭回归。
好的,谢谢您~,我先试试再请教!

使用道具

19
信__ 发表于 2017-3-25 14:52:30 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-9-28 17:52
需要用什么模型,一般是通过因变量的类型来判断的。你的因变量是离散型的(1-8),如果是有序的,则可 ...
假如是有序多类别因变量,自变量也是多类别,需要对因变量和自变量进行什么处理和分析再进行回归吗?

使用道具

20
xddlovejiao1314 学生认证  发表于 2017-3-26 12:19:45 来自手机 |只看作者 |坛友微信交流群
信__ 发表于 2017-3-25 14:52
假如是有序多类别因变量,自变量也是多类别,需要对因变量和自变量进行什么处理和分析再进行回归吗?
因变量不用处理,自变量处理为虚拟变量再纳入模型。祝好运~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-4 12:36