名字 | 数值 |
tom | 2 |
tom | 15 |
tom | 8 |
tom | 88 |
mary | 88 |
mary | 90 |
mary | 289 |
在每组的后面添加一个变量,如"距离",值为每一个数值减去对应该组平均值的绝对值,如第一条记录,tom 2,对应的距离为 2-28.25绝对值为26.25;mary 88,对应的距离为88-155绝对值为67,得到如下数据集:
名字 | 数值 | 距离 |
tom | 2 | 26.25 |
tom | 15 | 13.25 |
tom | 8 | 20.25 |
tom | 88 | 59.75 |
mary | 88 | 67 |
mary | 90 | 65 |
mary | 289 | 134 |
三、然后用距离去和每组的标准差做比较,剔除距离大于1倍标准差的观测值,最后得到的数据集如下:
名字 | 数值 | 距离 |
tom | 2 | 26.25 |
tom | 15 | 13.25 |
tom | 8 | 20.25 |
mary | 88 | 67 |
mary | 90 | 65 |
以上两个个步骤,请问大神,用SAS代码应该怎么写呢?谢谢各位~