楼主: jiajiaqiqigugu
1727 1

[问答] 异常数据的识别 [推广有奖]

  • 0关注
  • 2粉丝

硕士生

68%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1283 点
帖子
113
精华
0
在线时间
92 小时
注册时间
2016-6-10
最后登录
2017-4-9

楼主
jiajiaqiqigugu 发表于 2016-10-4 17:29:36 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

> head(w)

  平均值 最大值 最小值

1  0.181  0.185  0.180

2  0.180  0.180  0.180

3  0.180  0.190  0.175

4  0.175  0.180  0.170

5  0.173  0.175  0.170

6  0.170  0.175  0.170    #w一共有7776行数据。

> sum(complete.cases(w)) #统计完整值的行数

[1] 7772

> sum(!complete.cases(w))#统计缺失值的行数

[1] 4

> mean(!complete.cases(w))#缺失值所占的比例

[1] 0.0005144033

> w[!complete.cases(w),]#缺失值所在的位置

     平均值 最大值 最小值

180      NA     NA     NA

3681     NA     NA     NA

3689     NA     NA     NA

5909     NA     NA     NA

sp=boxplot(w[,2],boxwex=0.7)#画w中最大值这一列的箱形图

title("最大浓度异常值箱形图")

xi=1.1

points(xi,mn.s,col="red",pch=18)#平均值的位置。

sd.s=sd(w[complete.cases(w),2])#求标准差

mn.s=mean(w[complete.cases(w),2])#求平均值

arrows(xi,mn.s-sd.s,xi,mn.s+sd.s,code=3,col="blue",angle=75,length=.1) #通过箭头画上下界限。

text(rep(c(1.05,0.95),length(sp$out)/2),sp$out,sp$out,col="red")

QQ截图20161004172239.png

画出来的如图所示。

请问:1、arrows(xi,mn.s-sd.s,xi,mn.s+sd.s,code=3,col="blue",angle=75,length=.1)箱形图中已经有上下界限了,用arrows()函数的作用是什么?

2、text(rep(c(1.05,0.95),length(sp$out)/2),sp$out,sp$out,col="red")这一行看不懂,请解释

3、图中数据全部叠在一块看不清楚,怎么识别到底哪个数是异常值,以及异常值所处的位置。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Complete BOXPLOT length Arrows Points 平均值 最大值 统计

沙发
丁兆海4 在职认证  学生认证  发表于 2016-10-5 20:30:30
猜一下第2个问题,就是将异常点的值标红色。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-28 14:24