目前调研了395份问卷,准备写一篇论文。因为我是会计专业的,在统计学知识方面相对薄弱,所以请教了一个数学专业的同学。他告诉我,一般程序是:
1在还没有做回归的时候,根据均值的t检验,通过判断因变量取不同值时,自变量均值是否有显著区别,来剔除变量。
2做相关系数矩阵,若两个变量的r值绝对值较大,则剔除一个。
3做回归。
我的疑问是:
1在张文彤老师的书上介绍,对变量的筛选的影响强度,由强到弱为:专业判断、多变量分析、单变量分析。而上述方法第1、2步骤,仅根据单变量分析就剔除了变量,并没有给予专业判断和多变量分析的机会,是否合理?
2我用SPSS做logistic回归,会出现迭代次数达到20次,停止迭代,这个会影响回归的准确性么,为什么会出现这个说明?
3对于多分类的协变量,把它设置为分类变量后,对该变量赋值为为1234和ABCD,回归结果有区别吗?


雷达卡




京公网安备 11010802022788号







