楼主: chidos
1394 0

[学习分享] 强影响点问题交流 [推广有奖]

  • 0关注
  • 0粉丝

学前班

40%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
20 点
帖子
1
精华
0
在线时间
0 小时
注册时间
2017-1-17
最后登录
2017-1-18

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近在学习R语言,在看R语言实战这本书,今天看到了第八章第8.4.3强影响点章节(183页)

书上说cook's D值大于4/(n-k-1),则表明是强影响点,其中k为预测变量数量
那么k值应该是不包含截距项的,也就是书中前面提到的p值-1,(p值是包含截距项的)
cutoff <- 4/(nrow(states)-length(fit$coefficients)-2)
plot(fit,which=4,cook.levels=cutoff)
abline(h=cutoff,lty=2,col="red")


我的问题是:
代码第一行应该是cutoff <- 4/(nrow(states)-length(fit$coefficients))才对吧?

本身n-p就多减了一个1,后面应该+1再-1

n-k-1=n-(k+1)=n-p   而不是  n-p-2

也不知道我理解的对不对,如果不对,烦请指正

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:cutoff R语言实战 Cook R语言 截距项 影响

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-23 17:30