楼主: siweily
1893 1

[问答] 判别分析DISCRIM 非参数方法中 R值的设定 [推广有奖]

  • 2关注
  • 0粉丝

高中生

32%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
198 点
帖子
21
精华
0
在线时间
22 小时
注册时间
2012-10-23
最后登录
2013-12-19

楼主
siweily 发表于 2013-7-30 14:55:59 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
要做一个分类模型。首先用了参数方法,脚本如下,最终执行结果错误率比较高。
DATA work.VW_YG_DATA;
PROC DISCRIM distance OUTSTAT=DISSTAT PCORR POOL=TEST ANOVA MANOVA CROSSLISTERR;
CLASS ISSALE;
VAR SEX AGE GZPHD TDPHD BXRKD ISHAVESB CAREER VILLAGE PPZXD;


由于以上的分析结果,错误率比较高,心想是不是有问题。对所有变量进行正态分析,有一个变量的正太分布不是很好.
就改用非参数方法进行分析,脚本如下:

DATA work.VW_YG_DATA;
PROC DISCRIM method = npar R = 0.2 distance;
CLASS ISSALE;
VAR SEX AGE GZPHD TDPHD BXRKD ISHAVESB CAREER VILLAGE PPZXD;
RUN;


这个执行完之后,错误率是9%,觉得效果还挺不错,再试着把R值改为0.1,错误率变成了2%.再把R值改成0.4时,错误率又变为了18%。真不知道这个R值到底该取多少,这个问题一直在困惑我。问了好多人都不太清楚,求大牛指点!!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:discrim 判别分析 DISC scri Rim distance method 正太 模型

沙发
siweily 发表于 2013-7-31 13:38:23
只能自己顶了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-30 14:44