贝尔实验室等机构原来使用数据。是对于美国人手写数字的样本扫描后的像素数据,用来训练和测试机器学习。是众多机器学习、统计学习领域著名的数据案例,比如Vapnik, 1996。此数据集摘自《The Elements of Statistical Learning: Data Mining, Inference, and Prediction》(T.Hastie, R. Tibshirani, J. Friedman)的网页。但是原来的数据集比较散乱,没有名称,而且是txt形式,不易直接使用。本人对数据进行了基本的整理,以csv格式上传。希望对各位有兴趣的同仁有所帮助。
数据每行的一个列,是书写的数字,变量名为number,随后的256列,是对于数字扫描的256个像素,变量名分别为pix1 .......pix256。数据集分为训练集(train)和测试集(test).


雷达卡



京公网安备 11010802022788号







