楼主: softache
5275 8

[问答] SAS新人求教年龄分组 [推广有奖]

  • 0关注
  • 0粉丝

银牌贵宾

初中生

80%

还不是VIP/贵宾

-

威望
0
论坛币
29962 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
127 点
帖子
13
精华
0
在线时间
16 小时
注册时间
2012-11-21
最后登录
2016-6-4

100论坛币
我有一组样本数据,此处截出部分数据:

我要考察的是第4个字段即违约与年龄的关系,我想根据违约情况对年龄先进行一个分段,请问该如何进行分段或者我第一步该做什么?谢谢好心人。


附上使用proc univariate var age的数据:

最佳答案

WUPUQU 查看完整内容

1.如果真的太离散,木有办法拆分,那就直接当做一组咯。以你给的数据为例:26,56-59,60-以上明显是可以作为一组的,其他的年龄可以就当做一组,不再拆分。 其实这里还要看各年龄的人数占比。如果占比大,违约比例特殊,也可以单独作为一组进行研究。 PS:其实可以直接利用统计工具进行最优分箱
关键词:新人求教 Univariate Variate 样本数据 该做什么 好心人 做什么 如何 样本
沙发
WUPUQU 发表于 2015-5-27 09:49:03 |只看作者 |坛友微信交流群
softache 发表于 2015-6-2 11:38
谢谢您的回复,但是如果年龄和违约率之间比较离散,那又该如何划分呢?
1.如果真的太离散,木有办法拆分,那就直接当做一组咯。以你给的数据为例:26,56-59,60-以上明显是可以作为一组的,其他的年龄可以就当做一组,不再拆分。
其实这里还要看各年龄的人数占比。如果占比大,违约比例特殊,也可以单独作为一组进行研究。

PS:其实可以直接利用统计工具进行最优分箱

使用道具

藤椅
Tigflanker 发表于 2015-5-27 10:18:37 |只看作者 |坛友微信交流群
我们以前的做法是查资料和绘制散点图分析。。

使用道具

板凳
WUPUQU 发表于 2015-5-27 18:54:39 |只看作者 |坛友微信交流群
1.先统计每个年龄的违约人数,计算违约比例
2.画图看“年龄*违约比例”分布,或者直接根据违约比例数据,将比较接近的年龄划为一组

使用道具

报纸
wodematlab 发表于 2015-5-28 22:18:52 |只看作者 |坛友微信交流群
你可以划分区间,利用WOE的方法进行年龄分组。。

使用道具

地板
softache 发表于 2015-6-2 09:39:10 |只看作者 |坛友微信交流群
wodematlab 发表于 2015-5-28 22:18
你可以划分区间,利用WOE的方法进行年龄分组。。
谢谢您的回复,但正是因为第一步区间不知道该怎么划,如果随意去划的话也无依据。

使用道具

7
softache 发表于 2015-6-2 11:38:37 |只看作者 |坛友微信交流群
WUPUQU 发表于 2015-5-27 18:54
1.先统计每个年龄的违约人数,计算违约比例
2.画图看“年龄*违约比例”分布,或者直接根据违约比例数据,将 ...
谢谢您的回复,但是如果年龄和违约率之间比较离散,那又该如何划分呢?
年龄违约率

26

66.67

27

0.00

28

9.09

29

13.73

30

2.50

31

13.85

32

9.91

33

13.05

34

10.74

35

12.01

36

10.10

37

13.65

38

13.36

39

8.67

40

10.23

41

9.14

42

9.73

43

12.46

44

10.71

45

13.72

46

11.34

47

12.32

48

8.89

49

12.80

50

13.44

51

11.08

52

9.65

53

9.38

54

9.69

55

11.19

56

8.50

57

8.05

58

8.90

59

7.71

60

3.38

61

2.90

62

3.16

63

2.48

64

0.99

65

0.99

66

2.99

67

0.00

68

0.00

69

0.00

使用道具

8
softache 发表于 2015-6-3 17:51:43 |只看作者 |坛友微信交流群
WUPUQU 发表于 2015-5-27 09:49
1.如果真的太离散,木有办法拆分,那就直接当做一组咯。以你给的数据为例:26,56-59,60-以上明显是可以作 ...
我已把最佳答案给你了,不知道有没有收到悬赏的奖励。

另外,我想继续求教,如何使用SAS来做最优分箱。

使用道具

9
WUPUQU 发表于 2015-6-3 19:13:08 |只看作者 |坛友微信交流群
softache 发表于 2015-6-3 17:51
我已把最佳答案给你了,不知道有没有收到悬赏的奖励。

另外,我想继续求教,如何使用SAS来做最优分箱。 ...
1.你可以参考这里的sas em的binning
http://blog.sina.com.cn/s/blog_5d3b177c0100kbh3.html
至于code暂时木有

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 16:55