我在EM里做了个简单的logit模型,
流程:data-->data set attributes-->data partition-->regression-->assessment-->report
其中,partition部分我将数据分为:train 60%, validation 40%。
问题:
1.如果说train data是用来生成模型的,那么validation data和test data用途上有什么区别呢?assessment里应该用哪个data做评估?
2.我知道regression节点会根据回归结果生成一个scored data set,那么这个set是仅包括train data的score还是所有数据的score?我从哪里能看到这些score?
3.运行后report里面说:
Train data set is selected for assessment.
Validation data set is not selected for assessment.
如果要用validation data来做assessment,在哪里可以设置?
看了一下SAS帮助,里面貌似说assessment界面上的options tab可以设置"active data set (training, validation (default), test)",但我打开assessment的options后发现里面全都是阴影字,不让选的。问题出在哪里了呢?
[此贴子已经被作者于2008-5-20 11:15:59编辑过]


雷达卡



京公网安备 11010802022788号







