安德森鸢尾花数据集/Fisher's Iris Data是学习多元统计的必备数据集,但是很惊奇地发现论坛里居然没有这个数据集供下载,其实这是练习多元统计各种统计方法非常好的数据集。于是特意找来这个数据集,下面是维基百科对这个数据集的介绍:
安德森鸢尾花卉数据集(英文:Anderson's Iris data set),也称鸢尾花卉数据集(英文:Iris flower data set)或费雪鸢尾花卉数据集(英文:Fisher's Iris data set),是一类多重变量分析的数据集。它最初是埃德加·安德森集从加拿大加斯帕半岛上的鸢尾属花朵中提取的地理变异数据,后由罗纳德·费雪作为判别分析的一个例子,运用到统计学中。
其数据集包含了50个样本,都属于鸢尾属下的三个亚属,分别是山鸢尾、变色鸢尾和维吉尼亚鸢尾。四个特征被用作样本的定量分析,它们分别是花萼和花瓣的长度和宽度。基于这四个特征的集合,费雪发展了一个线性判别分析以确定其属种。
象征性地收一个币,有些其实没必要下载的同学就不用来“收集资料”了,减少服务器负荷。