楼主: reduce_fat
417 2

[CFA] 关于决策树和GLM的优劣势对比 [推广有奖]

荣誉版主

海外论坛首席管理员

已卖:18504份资源

泰斗

28%

还不是VIP/贵宾

-

TA的文库  其他...

海外原创经济论文和写作技巧

威望
11
论坛币
3591257 个
通用积分
34054.8393
学术水平
6834 点
热心指数
7193 点
信用等级
6665 点
经验
1830 点
帖子
12424
精华
78
在线时间
1974 小时
注册时间
2011-6-13
最后登录
2025-10-23

一级伯乐勋章 初级热心勋章 初级学术勋章 中级热心勋章 中级学术勋章 高级学术勋章 初级信用勋章 特级学术勋章 高级热心勋章 中级信用勋章 特级热心勋章 高级信用勋章 特级信用勋章

楼主
reduce_fat 发表于 2019-12-11 14:16:20 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
以前开了个帖子,全英文的决策树和GLM对比,从不同的笔记和考试里整理出来的,结果被学道会收走了,在论坛看不了。 手机没装学道会app 也打不开。 没有备份。 但是我还记得大概内容,这个大约是最容易记忆的预测模型间的优劣势对比。

就用中文打一遍吧,除了在论坛里,我也不常用中文的:

大体意思如下: 记住不论优劣势要紧扣模型对比的关联性,不要单列优劣势。 你列出以下优劣势中的任意三条就足够满分了。


和GLM对比,决策树有四点优势:

1. 决策树可以很简单的把结果解释给我们的客户听因为它特有的如果否则规则,但是GLM 得跑模型还得手动看哪个自变量有意义才能知道最终重要变量。

2. 决策树能很容易找出数据中的非线性关系但是GLM 不能。

3. 决策树可以很快的剔除没有意义的自变量,不像GLM那样跑逐步逐层的跑线性回归过程,才能选出最终变量。 这样省时省力。

4. 决策树可以自动找出关联变量,GLM也可以找出关联变量但得画图看了后再放到模型里跑出来看是否有意义。

决策树也有四点劣势:

1. 当新数据加到原始数据中的时候, 决策树会产生不确定的结果,比如树的解构和变量选择发生变化。 但是GLM加些新数据,一般不会受很大影响。

2. 决策树比GLM 更容易遇到 overfitting 过度适合的问题,意思是说train 的数据表现太好,但是test 的数据表现太差。

3. 决策树不能像GLM那样给找出来的重要变量指出 对目标变量的变化的数值大小。

4. 决策树的最终剪修出来的树会很依赖于train 数据的变化,和第一点劣势差不多,这会导致不必要的大方差。

就这些了。别的看我其他帖子的英文整理吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:决策树 优劣势 Fitting Train 非线性关系

复制粘贴积分链接 https://bbs.pinggu.org/ext8_airdrop.php?airdropfrom^^uid=2669999

沙发
铁剑007 发表于 2019-12-11 19:41:42
感谢分享,点赞

藤椅
reduce_fat 发表于 2019-12-12 01:51:24
铁剑007 发表于 2019-12-11 19:41
感谢分享,点赞
评分键在主贴下方,请评分指数。 关联变量不知道翻译的对不对,应该是Interaction Variable 这个大家都知道的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 11:22