SPSS Modeler 是一个非常优秀的数据挖掘软件。前身是SPSS Clementine
及PASW Modeler。该软件的特征选择节点有助于识别用于预测特定结果的
最重要的字段。特征选择节点可对成百乃至上千个预测变量进行筛选、排序,
并选择出可能是最重要的预测变量。最后,会生成一个执行地更快且更加有
效的模型—此模型使用较少的预测变量,执行地更快且更易于理解。
案例中使用的数据为“上海高中生家庭教育的调查”,包含有关该CY
二中的 304名学生参与环保活动的信息。该数据包含几十个的字段(变量),
其中有学生年龄、性别、家庭收入、身体状况情况等统计量。其中有一个
“目标”字段,显示学生是否参加过环保活动。我们想利用这些数据来预测
哪些学生最可能在将来参加环保活动。