楼主: gz0422lulu
4249 13

[CFA] 大牛求助,问个classification modeling的问题 [推广有奖]

11
yang1986ycj 发表于 2014-3-31 12:40:38
maomaochongz 发表于 2014-3-30 23:55
请问这些文献你是通过什么渠道找到的?很有意思
喔,有个领域是做论文时导师推荐看的,大多数都是谷歌学术搜到的。

12
lanyan123456 发表于 2014-4-1 11:41:20
分那么多组,数据量会不会太少?

13
maomaochongz 发表于 2014-4-2 04:16:27
yang1986ycj 发表于 2014-3-31 12:40
喔,有个领域是做论文时导师推荐看的,大多数都是谷歌学术搜到的。
谢谢                     

14
didizhang 发表于 2014-4-11 22:31:45
不知道这50万个记录有没有对应的数值变量可作为response variable的。比如,50万条车险保单的保费作为response,车型是目标categorial variable。那么拟合GLM后观察residual,离群值对应的记录很可能是分类错误的。这个思路的前提假设是:1、response是准确的,即,不是由这个categorial var得出的;2、residual中不包含其他的effect。如果楼主能提供更多的背景资料的话,也多大家会有更多更好的想法。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 08:15