楼主: onlyroxanne
3010 8

[问答] SAS Statistics 中的一道考题求解 [推广有奖]

  • 0关注
  • 0粉丝

已卖:334份资源

高中生

67%

还不是VIP/贵宾

-

威望
0
论坛币
1661 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
515 点
帖子
8
精华
0
在线时间
55 小时
注册时间
2013-6-3
最后登录
2013-8-3

楼主
onlyroxanne 学生认证  发表于 2013-6-19 03:02:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人非统计专业,正在准备数据分析师的考试。刚刚看完两本教材,拿来a00-240的考题想练练手,结果发现自己很多知识都理解的不够扎实到位,错误百出。。。

这道是考卷中的第8题:

Suppose training data are oversampled in the event group to make the number of events and non- events roughly equal. A logistic regression is run and the probabilities are output to a data set NEW and given the variable name PE. A decision rule considered is, "Classify data as an event if probability is greater than 0.5." Also the data set NEW contains a variable TG that indicates whether there is an event (1=Event, 0= No event).
                                                                                                                        [size=10.000000pt]The following SAS program was used:

Data NEW;
    set NEW;
    Solicit = PE > .5;
run;
proc means data=NEW(where = (TG = 1)) mean;
    var Solicit;
run;


[size=10.000000pt]What does this program calculate?                                       
[size=10.000000pt]A. Depth
B. Sensitivity
C. Specificity
D. Positive predictive value                                        
                                
                        
               

[size=10.000000pt]

[size=10.000000pt]

[size=10.000000pt]我知道Depth/Sensi/Spec/PV+这几个Statistics应该怎样求得,但是我现在对于NEW这个data set里面的三个变量(PE,Solicit,TG)理解比较混乱,所以不知道应该怎样往公式里面代入。还请大家帮忙。谢谢啦。













二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Statistics statistic Statist Statis ATI training whether number events 分析师

沙发
黄广西 发表于 2013-6-19 06:06:17
英语不好啊,看不懂....

藤椅
onlyroxanne 学生认证  发表于 2013-6-19 22:04:03
我大致翻译一下:
过度采样的训练数据中事件发生的概率近似于0.5。进行logistic回归后的probability作为变量PE被存入新的data set NEW中。NEW中还有一个变量叫TG。TG的value是1或0,分别表示probability大于或小于0.5。接着就是SAS program了。

以下是我结合Confusion Matrix的理解:
rho1=0.5,PE表示Predicted Value,那么Solicit就是Predicted Positive,TG是Actual Positive。
这里求的是Mean(Solicit)given Actual Postive。不知道我这样理解对不对。。。
但是我不明白怎么就从Mean(Solicit)given Actual Postive=True Positive/Actual Positive=Sentivity了。。。


PS:
Confusion Matrix:
Actual\Predict             0(Predicted Negative) |  1(Predicted Positive)
0(Actual Negative)                 True Negative  |  False Positive
1(Actual Positive)                  False Negative  |  True Positive

板凳
Kalet 在职认证  发表于 2013-6-20 15:06:25
PE是从模型预测出来的,这个事件(每一个观测)发生的概率;
Solicit你可以理解为(每一个观测)被认为是预测发生了(发生了Solicit=1),这就是“Predicted Positive”;
TG是(每一个观测)实际是否发生(发生了TG=1),这就是“Actual Positive”;

灵敏度(Sensitivity)=(Ture positives)/(total actually positive)=最后那个proc means运行出来的结果。

具体看看<Predictive Modeling Using Logistic Regression>的4-33,多看几遍就明白了。

报纸
onlyroxanne 学生认证  发表于 2013-6-21 01:56:30
Kalet 发表于 2013-6-20 15:06
PE是从模型预测出来的,这个事件(每一个观测)发生的概率;
Solicit你可以理解为(每一个观测)被认为是预 ...
谢谢你呀,可我还是不太理解proc means运行的结果是如何等于TP/AP的,可不可以解释一下?

地板
jingju11 发表于 2013-6-21 05:21:52

& T

proc means data=NEW(where = (TG = 1)) mean;
    var Solicit;
run;
{TG =1} is to select those with observed event (regard it as true). {Solicit=1} are those scored (tested) as an event and {solicit =0} as a non-event. So here the mean == #{solicit=1 & TG=1}/#{TG=1}, which is defined by sensitivity: if it is an event, how likely we can test it as an event. In medical field, that is an upmost important indicator for a test. We cannot afford any chance of missing a sick person (having event). Just for my curiosity, what is depth?
Jingju

7
onlyroxanne 学生认证  发表于 2013-6-21 08:43:59
jingju11 发表于 2013-6-21 05:21
{TG =1} is to select those with observed event (regard it as true). {Solicit=1} are those scored ( ...
I finally get it. Thanks so much:)

Depth is the total proportion of cases that were allocated to class 1(having event).

8
紫血丹心 在职认证  发表于 2013-6-21 20:16:38 来自手机
(p1+p2+p3+....+pn.)/(1+1+1+1+1+....)这就相当于求平均
拼搏

9
sasha2000 发表于 2013-7-12 13:34:18
真牛!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-5 12:52