最近在用逻辑回归做因素评价(包括各个因素之间的相互影响),主要影响因素如下:1,称作为空间,有4种,分别叫做Lab,Luv,grey,RGB,这些空间每次只能选择一个,在设置时需要三个dummy变量,以RGB为参考;
2,称作为k值,k可以取值为1,3,5,7四个值,和1类似,每次k只能为一个值,同样设置三个dummy变量,以k=7作为参考;
3,称作为特征,共有六种因素,分别为:Mean,Std,M2,M3,M4,M5,每一个都为一个dummy变量,取值为1或0,取值为1说明使用这个特征因素
实验的结果形式为:一种空间下,一个k值,在特征的一个组合的情况下,分类物品的正确率(如,在Lab下,k=1,选择Mean和Std(即Mean=1,Std=1,M2=0,M3=0,M4=0,M5=0),分类正确率为97%)。
p(正确率) 空间 k值 Mean Std M2 M3 M4 M5
0.97 lab 1 1 1 0 0 0 0
现在想问:
(1),空间对应成三个dummy变量,并且是以RGB这个为参考是什么意思?转化成变量是否类似如下(个人理解,是有三个新的变量):X1=Lab,X2=Luv,X3=grey,当选取Lab时,对应就是(X1=1,X2=0,X3=0),当选取Luv时,对应就是(X1=0,X2=1,X3=0)当选取grey时,对应就是(X1=0,X2=0,X3=1),然后RGB就是(X1=0,X2=0,X3=0),不知道这种理解是否正确?
(2)上面的实验结果统计出来,导入到SPSS中,上面对应的这些变量该如何设置?(按照(1),会有12个自变量,一个因变量,在逻辑回归下,因变量对应成为:log(p/1-p),是不是需要在导入实验数据前将第一列的p转换成log之后的结果)
希望又懂得的人帮忙解答一下,多谢了啊,很急很急~


雷达卡



京公网安备 11010802022788号







