一、数据集背景:医学影像分析核心支撑
该数据集聚焦脑肿瘤医学影像研究,专为脑肿瘤分割(肿瘤区域精准定位) 与分类(肿瘤类型识别) 双任务设计,可直接用于AI辅助诊断模型训练(如CNN、Transformer等算法)、临床影像分析方法验证,解决当前脑肿瘤研究中“样本量不足、标注不完整”的痛点,适配全球医学研究机构、高校医学院、医疗AI企业的研发需求,数据均经过隐私脱敏处理,符合医学伦理规范。
二、数据核心信息:数量与分类
1. 总规模:约5000张脑肿瘤MRI切片,覆盖“无肿瘤+3类常见脑肿瘤”场景,样本分布均衡,避免模型偏倚;
2. 肿瘤类型细分:
无肿瘤(No Tumor):约1200例,为正常脑MRI切片,用于模型对照训练;
神经胶质瘤(Glioma):约1300例,含低级别、高级别胶质瘤亚型,覆盖不同病灶大小;
脑膜瘤(Meningioma):约1250例,包含颅内不同位置(如大脑凸面、颅底)病灶;
垂体瘤(Pituitary):约1250例,含增强扫描序列切片,适配垂体瘤特异性诊断需求;
3. 分割掩码数据:约2700例,精准标注肿瘤核心区、水肿区(部分类型)等关键区域,标注由资深放射科医师审核,确保准确性。
三、数据格式:兼容医学与AI工具
核心格式:NIfTI(.nii)、DICOM(.dcm),均为医学影像标准格式,支持临床MRI设备直接导出与读取;
辅助文件:JSON格式数据字典,含切片层厚、扫描序列(T1、T2、FLAIR等)、患者信息脱敏说明(无姓名、ID等隐私数据);
工具兼容性:适配Python(SimpleITK、NiBabel库读取)、MATLAB(Image Processing Toolbox)、医学影像软件(3D Slicer、ITKSNAP)、AI框架(PyTorch、TensorFlow),可直接用于预处理与模型训练。
四、数据可用途径:3大权威渠道
1. 医学专业平台(优先推荐):
TCIA(The Cancer Imaging Archive):搜索“Brain Tumor MRI Segmentation & Classification Dataset”,注册后签署数据使用协议即可免费下载;
BraTS Challenge官网:作为竞赛配套数据集,提供完整版(含分割掩码),适合算法性能对比研究;
2. 学术数据库:
IEEE DataPort、Dryad:检索数据集DOI号(若有),获取高校团队整理的标准化数据,支持学术引用导出;
3. 开源社区与机构:
GitHub:搜索“Brain Tumor MRI Dataset with Segmentation Masks”,获取含预处理脚本的开源版本;
国内外医学影像实验室:如“国家医学影像中心”“MIT计算机科学与人工智能实验室”,通过合作申请可获取定制化数据(如特定肿瘤亚型补充)。
五、数据集目录(按类型分类)
1. 基础MRI切片数据集(共约5000张)
1.1 无肿瘤(No Tumor)子目录:1200张正常脑MRI切片(含T1、T2加权序列);
1.2 神经胶质瘤(Glioma)子目录:1300张切片(分低级别、高级别子文件夹);
1.3 脑膜瘤(Meningioma)子目录:1250张切片(按病灶位置分类);
1.4 垂体瘤(Pituitary)子目录:1250张切片(含增强扫描序列子文件夹);
2. 分割掩码数据集(共约2700例)
2.1 神经胶质瘤分割掩码:700例(标注肿瘤核心区、水肿区、增强区);
2.2 脑膜瘤分割掩码:650例(标注肿瘤实质区);
2.3 垂体瘤分割掩码:650例(标注垂体瘤及周围结构);
2.4 无肿瘤对照掩码:700例(标注正常脑组织结构);
3. 辅助文件目录
3.1 数据字典(JSON):说明字段含义与标注标准;
3.2 预处理指南(PDF):含去噪、归一化操作步骤;
3.3 伦理协议模板:供学术使用时参考。


雷达卡




京公网安备 11010802022788号







