|
书目一、《SAS金融数据挖掘与建模》样例数据与代码
链接:https://pan.baidu.com/s/1yf6C41m-HoWldeukgfGd0Q 密码:rixy
第2章:补充说明一下
2-2模型打分代码
%rfscore(fraud_valdt_data,1000,score_valdt);
由于没有准备验证集“fraud_valdt_data“,因此可以使用训练集”fraud_train_samp1"直接打分,或者一分为二
2-3模型评估代码
%Fit(score_valdt,fit_valdt,100,pr,fraud);
宏里面的参数,需要根据实际数据修改,例如目标变量fraud在这个数据集里名字为“target”,请修改一下。
第3章:由徐老师撰写,原数据不便提供。另提供一份数据,可起到相同效果,文章和代码中有些变量的名称对不上,可不必细究,掌握操作过程即可。个别中间代码书中没有提供,请谅解,可参阅最后一章。
第4章:对于初学者可能内容过多,容易懵圈,我提供了新的代码和练习数据,过程简单而功能足够,可根据代码一段一段的运行,并观察输入、输出数据,会很快掌握这个方法的。考虑到KMEANS算法需要人工指定类数,但又不确定究竟应该聚几类,所提供的KMEANS_AUTO代码可以实现自动迭代,然后根据指标选择最佳聚类数量,供参考。
|