EMNIST 手写数字数据集 28×28 像素 Extended MNIST NIST Special Database 19 扩展版
EMNIST 手写数字数据集(Extended MNIST)是NIST Special Database 19的官方扩展数据集,完美兼容 MNIST 数据集结构,将所有图像统一转换为28×28 像素标准格式,数据量为经典 MNIST 数据集的 4 倍,是机器学习、计算机视觉领域的优质实验数据资源。
本资源包含 EMNIST 全系列子数据集,覆盖不同字符类别、样本量及均衡性类型,满足各类算法训练、模型测试需求,具体包含:
EMNIST ByClass:814255 个字符,62 个不平衡类
EMNIST ByMerge:814255 个字符,47 个不平衡类
EMNIST Balanced:131600 个字符,47 个平衡类
EMNIST Letters:145600 个字符,26 个平衡类
EMNIST Digits:280000 个字符,10 个平衡类
EMNIST MNIST:70000 个字符,10 个平衡类
数据集适用途径
高校 / 科研机构的模式识别、手写字符识别算法研究
机器学习、深度学习入门与进阶的模型训练(如 CNN、神经网络等)
计算机视觉相关课程的实验教学、课程设计
人工智能相关竞赛、项目开发的基础数据支撑
手写数字 / 字符识别相关产品的原型验证与算法优化
数据集核心优势
格式标准化:28×28 像素图像,与 MNIST 数据集结构完全匹配,无需额外格式转换
数据量丰富:为经典 MNIST 的 4 倍,样本覆盖更全面,提升模型泛化能力
分类多维度:含平衡 / 不平衡类、数字 / 字母类等多类子数据集,适配不同实验场景
溯源权威:基于 NIST Special Database 19 扩展,数据来源专业、可靠
EMNIST 手写数字数据集.zip
(6.39 KB, 需要: RMB 10 元)


雷达卡


京公网安备 11010802022788号







