大家好,
我在用score这个函数的时候有一些问题,以下变量中p_day_range Age_range TL_range 是categorical 的,其他变量都是数值型的,我先用
proc logistic data=train_data outmodel=Model;
class p_day_range Age_range TL_range;
model response=c_level Age_range p_day_range t_cost TL_range
run;
有一个记录用score最后我得到了一个0.014的response, 过程如下
proc logistic Inmodel=Model;
Score data=test_data out=test_data_1;
run;
这条记录各个输入项如下
c_level=0.75 t_cost=4850 p_day_range="80-99" TL_range="31-365" Age_range="40-59"
对应的系数是截距-7.635925
c_level=5.5295757386
t_cost=-0.000063008
p_day_range在模型输出没有这个level,模型选的这个level作为base,就是odd ratio的报表里都是各个level vs "80-99", 这一项我用的0
Age_range 在模型输出没有这个level,模型选的这个level作为base,就是odd ratio的报表里都是各个level vs "40-59", 这一项我用的0
TL_range:-0.3542494
Excel 算的结果是 F=-0.3542494+0+0-7.635925+4850*-0.000063008+0.75*5.5295757386=-4.1485
P=1/(exp(-F)+1)=0.01554
我想问一下为什么我用Excel算的结果会和SAS score的结果有差异
谢谢!