楼主: Dwight
1167 4

[数据挖掘理论与案例] [求助答疑] 是否有现有的概率分布适用我的数据? [推广有奖]

  • 0关注
  • 0粉丝

本科生

61%

还不是VIP/贵宾

-

威望
0
论坛币
1098 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
582 点
帖子
41
精华
0
在线时间
157 小时
注册时间
2005-4-29
最后登录
2023-3-26

楼主
Dwight 发表于 2016-11-18 06:20:27 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我先有一个数据集是关于个人贷款的银行数据。
假设我取2016年10月31日为数据时点,现有数据里包括从2010年到2016年第三季度末每一个季度发放的贷款明细,如贷款金额,是否违约,违约本金等等

我的目标数据是每个贷款组(按季度分组)在数据时点的违约率。
比如计算2010年第一季度的违约率:
按季度估算的违约率: = (截止数据时点2010年第一季度贷款的违约本金总和)/(2010年第一季度贷款总额)

所以该计算公式由两个连续变量的商构成。

请问: 对于每一个季度的违约率或违约金额是否有合适的概率分布来建模。

我设想用Beta distribution来建模(假定每一个分组贷款的违约概率服从Beta Distribution),但我的concern是这个违约率是两个金额相除,而不是两个贷款个数的比率。如果是后者,对于一个分组的N个贷款,违约贷款的笔数服从二项分布。违约率就是分布参数p。当然这是假定分组里所有贷款独立同分布。(暂不讨论这个假设是否成立)。在贝叶斯模型里,常常用Beta 分布来假定p的分布。回到以上的违约率,对于这个计算形式的违约率是否也可以用Beta分布来假设?或者有更好的方法来建模?

敬请指教,不胜感激。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:概率分布 distribution concern beta 第一季度 二项分布 贷款 模型 概率

沙发
foozhencheng 学生认证  发表于 2016-11-18 06:38:51 来自手机
感觉没什么问题。另外用Beta的原因除了它可以建模概率参数p外,还有一个原因是它是二项的共轭分布~

藤椅
Dwight 发表于 2016-11-18 06:49:32
foozhencheng 发表于 2016-11-18 06:38
感觉没什么问题。另外用Beta的原因除了它可以建模概率参数p外,还有一个原因是它是二项的共轭分布~
但思路上,如果目标数据是贷款笔数,那么违约笔数可服从二项分布,而违约率p可服从Beta 分布。 而现在目标数据是贷款金额。违约的本金金额是连续量,我不知有什么现有的连续分布可用来建模,而据此算出的违约率是否仍可以套用Beta? 也就是说,Beta分布可以适用广义的概率或比率的分布或者它只能适用基于二项分布的过程里的概率p?

板凳
foozhencheng 学生认证  发表于 2016-11-18 09:33:02
Dwight 发表于 2016-11-18 06:49
但思路上,如果目标数据是贷款笔数,那么违约笔数可服从二项分布,而违约率p可服从Beta 分布。 而现在目标 ...
可以认为总金额X为一个非负的连续随机变量,这样就可以考虑诸如Gamma、LogNormal之类的分布,同时违约率服从Beta分布。一个可以考虑的(其实也是非常漂亮的)模型是:定义X为违约资金量,Y为未违约的资金量,则U = X + Y为总资金量,W = X / (X + Y)为违约率。如果U ~ Gamma(\alpha + \beta, \lambda), W ~ Beta(\alpha, \beta)且U与W独立,那么X ~ Gamma(\alpha, \lambda), Y ~ Gamma(\beta, \lambda)且X与Y独立。

报纸
飞天玄舞6 在职认证  发表于 2016-11-18 09:43:11
用logistic回归不更好吗

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 00:34