楼主: fengyu04
2155 6

请高手来解答一下这几个概念。。 [推广有奖]

  • 0关注
  • 0粉丝

初中生

19%

还不是VIP/贵宾

-

威望
0
论坛币
205 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
46 点
帖子
5
精华
0
在线时间
14 小时
注册时间
2010-1-18
最后登录
2010-9-5

100论坛币
1 FICO credit score
2 Unexpected loss in a Basel II context
3 Information Value of a variable
4 AUC based pruning
小弟实在不懂这个是什么意思 越详细 越好啦, 最好能附上资料供小弟学习

关键词:information Unexpected Informatio formation Expected 概念 高手 解答
沙发
bird_3745_2001 发表于 2010-5-15 16:47:48 |只看作者 |坛友微信交流群
帮你顶下。。。。。。。。。

使用道具

藤椅
chenxueT 发表于 2010-5-15 16:50:55 |只看作者 |坛友微信交流群
最好到图书馆查一下  以前有涉及后来忘了

使用道具

板凳
foghow 发表于 2010-5-20 09:43:06 |只看作者 |坛友微信交流群
I am Baesens. I keep my eyes on Internet, dont even try to answer the question in this way. I am not stupid.

使用道具

报纸
dokers 发表于 2010-5-21 14:09:11 |只看作者 |坛友微信交流群
高手不敢当,尝试回答3个,看看楼主是否满意

FICO credit score
FICOFair Issac公司的名称,FICO credit scoreFair Issac公司开发的信用评分,例如根据征信报告计算个人客户违约风险,金融机构可根据该评分考虑是否批准客户的信用卡或贷款的申请。

Unexpected loss in a Basel II context
Expected loss 知道些,unexpected loss就不太了解。

Information Value of a variable
变量的information value(信息量)是用来评估变量对目标的预测能力predicitve power(或分辨能力discriminative power),例如变量年龄对于判断客户是否会违约的帮助有多大。
假如年龄分为3个区间,A120-30A230-40A3>40
#g(A1):表示年龄为20-30的客户中好客户(不违约)的数量,
#b(A1):表示年龄为20-30的客户中坏客户(违约)的数量,
#G:表示全体中好客户的数量
#B:表示全体中坏客户的数量
则年龄的信息量为:
[#g(A1)/ #G - #b(A1)/ #B]* ln[ (#g(A1)/ #G) / ( #b(A1)/ #B) ]
+ [#g(A2)/ #G - #b(A2)/ #B]* ln[ (#g(A2)/ #G) / ( #b(A2)/ #B) ]
+ [#g(A3)/ #G - #b(A3)/ #B]* ln[ (#g(A3)/ #G) / ( #b(A3)/ #B) ]


AUC based pruning
这个没有语境,不好理解。AUC based pruning可能是指决策树的减枝策略。
AUC倒是知道一些。AUC是指ROC曲线所覆盖的面积,AUC大则模型的性能好。ROC曲线:纵坐标是sensitivity,横坐标是1-specificity
Sensitivity表示在模型预测的前X%名单中,命中的个数占全部目标数量的比例。
1-Specificity表示在模型预测的前X%名单中,预测错误的个数占全部非目标数量的比例。
直观地说,sensitivity表示模型的预测目标的能力,1-specificity表示为此付出的代价。

使用道具

地板
luhuidal 发表于 2010-5-21 17:33:36 |只看作者 |坛友微信交流群
楼上对ROC的解释是错误的吧,
ROC只是针对二元目标变量而言的,其中纵轴是sensitivity, (sensitivity主要是衡量模型判断目标事件(events)的准确率,公式是(true positive events/total actual positives);
横轴是specificity,(specificity主要是衡量模型判断非目标事件(nonevents)的准确率的,公式为(true negative events/ total actual negatives).
不过,总的观察方法是不错的,该曲线覆盖下的面积越大,表明模型效果越好!

使用道具

7
dokers 发表于 2010-5-24 09:38:31 |只看作者 |坛友微信交流群
6# luhuidal
ROC曲线的确是说错了,横坐标应该是1-specificity,也就是False Positive占全部negative的比例。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 15:15