结论摆在最前面:
SPSS只有1个公式,所有软件都一样。
你的思路有问题。首先,如果自变量中存在哑变量,则哑变量需要满足“同进同出”原则,并且哑变量背后的分类自变量的显著性,并不是哑变量自身的显著性决定的,而需要根据“同进同出”原则查看“块(Block)”统计——即分层回归之间的差异的显著性。对于线性回归,是 Delta R-square 的显著性,对于二元的 Logistic 回归,则是似然比检验的显著性。——因此,你说显著的自变量里存在哑变量,这个思路已经有问题了,应该是“某个自变量产生的哑变量(们)整体对因变量有影响"。
其次,哑变量是实实在在的数据,只不过,如果你使用了SPSS为Logistic预设的哑变量,则看不到这些哑变量,并产生错觉“有一个分类自变量,对应了4个(或者更多的)哑变量”,并在结果中使用原始的分类自变量(1个)套公式。实际上应该先计算出哑变量(对于2分类自变量仅有1个哑变量,对于C分类自变量则有C-1个哑变量),再用哑变量套Logistic的回归系数公式。
最后,对于回归类型的分析,分类自变量设置哑变量(或称虚拟化, dummy coding),以及哑变量的系数解释,都是同一个套路。
可以参考
数据分析中的哑变量问题如何处理? - SPSS论坛 - 经管之家(原人大经济论坛) (pinggu.org)
或电子书里的章节
《问卷调查与SPSS引用》电子书发布——最学术且具有可操作性的软件书 - SPSS论坛 - 经管之家(原人大经济论坛) (pinggu.org)


雷达卡



京公网安备 11010802022788号







