楼主: alex_xt
2672 1

[实际应用] (金融行业实际应用)-信用评级建模流程 [推广有奖]

  • 0关注
  • 0粉丝

高中生

15%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0796
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
290 点
帖子
5
精华
0
在线时间
31 小时
注册时间
2015-11-5
最后登录
2017-6-12

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
大家好,目前正在对上市公司和发债主体做信用评级,由于使用软件为SAS,故发在SAS版。
目前建模过程中碰到了一些问题,将整体流程放上来,望得到大家的指正,谢谢!
建模数据:
某一行业内(例如房地产)所有上市/发债主体近5年财务指标的数据,前4年作为training data,最后一年做validation data。自变量为财务指标,因变量为违约标识(即违约为1,非违约为0);

建模流程:
1、对Training Data: 样本/指标缺失率若超过一定阈值则剔除该样本/指标 (指标即自变量);
2、对Training/Validation Data:缺失值填充,这里采用了3个办法,请问是否有更好的缺失值处理方法?
     2.1 全部样本均值填充 - 即缺失值采用样本内所有数据的均值替代;
     2.2 按年份区分的均值填充 - 即缺失值采用当年全部公司的均值替代;
     2.3 按公司区分的均值填充 - 即缺失值采用该公司其他年份的均值替代;     2.4 采用多重填补(Multiple Imputation, MI)进行填充,但是只生产一个数据集(因为不知道生成多个后如何用MIAnalyze进行处理
3、对Training Data:数据表现方向筛选:即考虑财务指标(自变量)与违约标识(因变量)的相关性(正负相关)与理论方向是否一致,如不一致则剔除;
4、对Training Data:指标GINI值筛选:计算每一个财务指标(自变量)的GINI,并剔除GINI低于0.1的指标 (由于自变量全部为财务指标,均为连续变量,一般不做离散化处理,所以无法计算WOE/IV),这步有比较大问题,无法判断自变量与因变量的关系是否线性,各位有没有办法可以处理?
5、对Training Data:因子分析(此处并未对变量做标准化处理,因为通过标准化系数计算因子得分的时候会对指标做标准化处理);
6、对Training/Validation Data:PROC SCORE分别计算Training和Validation的因子得分;
7、对Training:Logistic建模,将模型结果分别对Training和Validation Data,计算AUC。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:金融行业 信用评级 实际应用 Validation Imputation 上市公司 training 信用评级 实际应用 发债主体

沙发
abc630110845 发表于 2018-3-31 17:10:31 |只看作者 |坛友微信交流群
能不能把数据分享一下,大家可以一起帮你跑一下

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 23:40