- 利用乳腺肿块细针抽吸(FNA)的数字化图像的特征预测肿块是恶性还是良性(M=恶性,B=良性)。数据集的更多信息:[color=var(--colab-anchor-color)]https://scikit-learn.org/stable/datasets/toy_dataset.html#breast-cancer-wisconsin-diagnostic-dataset 下载数据:from sklearn.datasets import load_breast_cancer bcdat = load_breast_cancer() X, y = bcdat.data, bcdat.target
a. 进行降维和随后的预测(只能用5个特征,并解释不能使用整个数据集进行预测的成本/牺牲,以及你使用的工具/算法的理由)
b. 假设只有用整个特征数据集的至少95%的原始方差才能取得可信的结果。以这种方式进行降维和随后的预测。解释结果并与a的结果比较。