<P>谢谢斑竹支持。</P>
<P>同时斑竹说的对,这本书的数据集一直没有下载。</P>
<P>关于数据问题,我的建议是,大家如果有任何数据库文件,最好是transational Data,基本整合一下。(最好超过100000条数据)50000作training,50000作validation,根据书中变量稍微转换一下,自己模拟一个数据集,指定一个predict Variable(0/1),模拟其中提出的问题和解决方案。</P>
<P>比如说就可以根据文中提出的数据结构修改一下,以适应逻辑回归模型的建立。比如说他有一段</P>
<P>title2 "Modeling Activiate"; <BR>proc logistic data=acqod.model2 descending; <BR>weight smp_wgt; <BR>model activate = inc_est3 inc_miss infd_ag2 hom_equ2 tot_acc2 actopl62<BR>tot_bal2 inql6m2 age_fil2 totopac2 credlin2 crl_rat bal_rat no30day2 <BR>nobkrpt amtpdue no90eve /selection= s<FONT color=#f76809>tepwise</FONT> maxstep=1 details; <BR>run;</P>
<P>大家可以在自己的数据集里面设定一个predict variable 替换 active, 同时用其他的变量替换(inc_est3 inc_miss infd_ag2 hom_equ2 tot_acc2 actopl62<BR>tot_bal2 inql6m2 age_fil2 totopac2 credlin2 crl_rat bal_rat no30day2 <BR>nobkrpt amtpdue no90eve )</P>
<P>虽然结果不同,但是关键在于过程,熟悉模型的分析制作步骤。</P>