某商学研究生院的招生官员利用指标――大学期间平均成绩GPA和研究生管理能力考试GMAT的成绩,将申请者分为三类:接受,不接受,待定。表1中给出了三类申请者的GPA与GMAT成绩:
GPA(x1) | GMAT(x2) | 接受 | GPA(x1) | GMAT(x2) | 不接受 | GPA(x1) | GMAT(x2) | 待定 |
2.96 | 596 | 1 | 2.54 | 446 | 2 | 2.86 | 494 | 3 |
3.14 | 473 | 1 | 2.43 | 425 | 2 | 2.85 | 496 | 3 |
3.22 | 482 | 1 | 2.2 | 474 | 2 | 3.14 | 419 | 3 |
3.29 | 527 | 1 | 2.36 | 531 | 2 | 3.28 | 371 | 3 |
3.69 | 505 | 1 | 2.57 | 542 | 2 | 2.89 | 447 | 3 |
3.46 | 693 | 1 | 2.35 | 406 | 2 | 3.15 | 313 | 3 |
3.03 | 626 | 1 | 2.51 | 412 | 2 | 3.5 | 402 | 3 |
3.19 | 663 | 1 | 2.51 | 458 | 2 | 2.89 | 485 | 3 |
3.63 | 447 | 1 | 2.36 | 399 | 2 | 2.8 | 444 | 3 |
3.59 | 588 | 1 | 2.36 | 482 | 2 | 3.13 | 416 | 3 |
3.3 | 563 | 1 | 2.66 | 420 | 2 | 3.01 | 471 | 3 |
3.4 | 553 | 1 | 2.68 | 414 | 2 | 2.79 | 490 | 3 |
3.5 | 572 | 1 | 2.48 | 533 | 2 | 2.89 | 431 | 3 |
3.78 | 591 | 1 | 2.46 | 509 | 2 | 2.91 | 446 | 3 |
| ||||||||
|
(1)对表1中的数据作散点图,不同的类用不同的颜色标识;
(2)用lda函数做判别分析,即在协方差矩阵相等的情形下作判别分析;
(3)用qda函数做判别分析,即在协方差矩阵不相等的情形下作判别分析;
(4)比较方法(2)和方法(3)的误判率;
(5)现有一新申请者的GPA为3.21,GMAT成绩为497。请将该观测在(1)的散点图中标出,并分别用方法(2)和方法(3)将其归类?你认为哪一种方法更合适?
(6)观察(1)的散点图中第三类的观测点有无异常值?若有,将该异常值剔除后再对新申请者判别归类,结果有无变化?
望各位大神给解答一下,尤其是(1),画散点图该怎么写程序?