楼主: softache
5952 8

[问答] SAS新人求教年龄分组 [推广有奖]

  • 0关注
  • 0粉丝

银牌贵宾

初中生

80%

还不是VIP/贵宾

-

威望
0
论坛币
29962 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
127 点
帖子
13
精华
0
在线时间
16 小时
注册时间
2012-11-21
最后登录
2016-6-4

楼主
softache 发表于 2015-5-27 09:49:02 |AI写论文
100论坛币
我有一组样本数据,此处截出部分数据:

我要考察的是第4个字段即违约与年龄的关系,我想根据违约情况对年龄先进行一个分段,请问该如何进行分段或者我第一步该做什么?谢谢好心人。


附上使用proc univariate var age的数据:

最佳答案

WUPUQU 查看完整内容

1.如果真的太离散,木有办法拆分,那就直接当做一组咯。以你给的数据为例:26,56-59,60-以上明显是可以作为一组的,其他的年龄可以就当做一组,不再拆分。 其实这里还要看各年龄的人数占比。如果占比大,违约比例特殊,也可以单独作为一组进行研究。 PS:其实可以直接利用统计工具进行最优分箱
关键词:新人求教 Univariate Variate 样本数据 该做什么 好心人 做什么 如何 样本

沙发
WUPUQU 发表于 2015-5-27 09:49:03
softache 发表于 2015-6-2 11:38
谢谢您的回复,但是如果年龄和违约率之间比较离散,那又该如何划分呢?
1.如果真的太离散,木有办法拆分,那就直接当做一组咯。以你给的数据为例:26,56-59,60-以上明显是可以作为一组的,其他的年龄可以就当做一组,不再拆分。
其实这里还要看各年龄的人数占比。如果占比大,违约比例特殊,也可以单独作为一组进行研究。

PS:其实可以直接利用统计工具进行最优分箱

藤椅
Tigflanker 发表于 2015-5-27 10:18:37
我们以前的做法是查资料和绘制散点图分析。。

板凳
WUPUQU 发表于 2015-5-27 18:54:39
1.先统计每个年龄的违约人数,计算违约比例
2.画图看“年龄*违约比例”分布,或者直接根据违约比例数据,将比较接近的年龄划为一组

报纸
wodematlab 发表于 2015-5-28 22:18:52
你可以划分区间,利用WOE的方法进行年龄分组。。

地板
softache 发表于 2015-6-2 09:39:10
wodematlab 发表于 2015-5-28 22:18
你可以划分区间,利用WOE的方法进行年龄分组。。
谢谢您的回复,但正是因为第一步区间不知道该怎么划,如果随意去划的话也无依据。

7
softache 发表于 2015-6-2 11:38:37
WUPUQU 发表于 2015-5-27 18:54
1.先统计每个年龄的违约人数,计算违约比例
2.画图看“年龄*违约比例”分布,或者直接根据违约比例数据,将 ...
谢谢您的回复,但是如果年龄和违约率之间比较离散,那又该如何划分呢?
年龄违约率

26

66.67

27

0.00

28

9.09

29

13.73

30

2.50

31

13.85

32

9.91

33

13.05

34

10.74

35

12.01

36

10.10

37

13.65

38

13.36

39

8.67

40

10.23

41

9.14

42

9.73

43

12.46

44

10.71

45

13.72

46

11.34

47

12.32

48

8.89

49

12.80

50

13.44

51

11.08

52

9.65

53

9.38

54

9.69

55

11.19

56

8.50

57

8.05

58

8.90

59

7.71

60

3.38

61

2.90

62

3.16

63

2.48

64

0.99

65

0.99

66

2.99

67

0.00

68

0.00

69

0.00

8
softache 发表于 2015-6-3 17:51:43
WUPUQU 发表于 2015-5-27 09:49
1.如果真的太离散,木有办法拆分,那就直接当做一组咯。以你给的数据为例:26,56-59,60-以上明显是可以作 ...
我已把最佳答案给你了,不知道有没有收到悬赏的奖励。

另外,我想继续求教,如何使用SAS来做最优分箱。

9
WUPUQU 发表于 2015-6-3 19:13:08
softache 发表于 2015-6-3 17:51
我已把最佳答案给你了,不知道有没有收到悬赏的奖励。

另外,我想继续求教,如何使用SAS来做最优分箱。 ...
1.你可以参考这里的sas em的binning
http://blog.sina.com.cn/s/blog_5d3b177c0100kbh3.html
至于code暂时木有

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-2 05:07