ConstructionSite建筑工地图像数据集|UBC+哥大2025发布 10013张图(含安全违规标注)
一、数据集核心背景:聚焦施工安全的多模态AI评估基准
该数据集由英属哥伦比亚大学(UBC,加拿大) 与哥伦比亚大学(美国) 联合开发,于2025年正式发布,其研究成果对应论文为「Are Large Pretrained Vision Language Models Effective Construction Safety Inspectors?」。
核心目标是解决“施工安全AI模型缺乏真实场景数据”的痛点——为视觉语言模型提供“建筑工地安全场景”的标准化评估与训练基准,助力提升模型在施工环境下的图像理解、安全违规推理能力,直接适配工地AI安全巡检、智能风险识别等实际需求。
二、核心数据规模:10013张图像+训练测试双分拆
数据集总计包含10,013张真实建筑工地图像,按“训练测试”场景科学拆分,满足模型全流程开发需求:
训练集:7,009张图像,覆盖常见工地场景(如主体施工、材料堆放、设备作业),用于模型基础训练;
测试集:3,004张图像,包含更多复杂边缘场景(如恶劣天气施工、多设备交叉作业),用于模型性能验证。
三、数据核心内容:6类标注信息,覆盖安全检查全维度
每条数据均配套“图像+多维度标注”,精准匹配施工安全检查需求,具体包含:
1.基础信息:高清工地图像+对应的场景描述(如“3层楼板钢筋绑扎作业现场”);
2.安全违规问答:针对图像中潜在违规点的问答对(如“图中工人安全帽佩戴是否合规?答案:2名工人未佩戴安全帽”);
3.违规边界框:违规对象(如未戴安全帽的工人、未固定的脚手架)的精准位置标注;
4.目标检测类别:涵盖工地核心对象(如挖掘机、钢筋、佩戴白色安全帽的工人、塔吊);
5.图像属性:记录光照(强光/弱光)、相机距离(近景/远景)、视角(平视/俯视)、信息质量(清晰/模糊)等环境参数;
6.安全规则关联:标注图像对应的施工安全规范(如《建筑施工高处作业安全技术规范》相关条款)。
四、数据集核心特点:贴近真实施工安全场景
场景复杂性:覆盖不同施工阶段(地基、主体、装修)、不同环境条件(晴天/雨天、白天/夜间),还原真实工地多样性;
标注全面性:从基础图像描述到安全违规细节,再到目标位置,标注维度完整,无需额外补充数据;
实用性强:所有数据围绕“施工安全检查”设计,直接对接工地AI巡检系统的开发需求,避免数据与应用脱节。
五、核心使用场景与获取途径
1. 核心使用场景
AI模型开发:用于训练“工地安全违规识别模型”“施工目标检测模型”“多模态安全问答模型”;
学术研究:支撑“视觉语言模型在工业安全场景的适配性”“施工安全AI评估标准”等课题;
行业应用:帮助建筑企业搭建智能安全巡检工具,提升工地安全检查效率(如自动识别未戴安全帽、违规操作)。
2. 权威获取途径
优先通过IEEE DataPort、GitHub学术仓库获取,或访问英属哥伦比亚大学/哥伦比亚大学的科研数据平台,搜索数据集名称“ConstructionSite”即可下载;下载包含图像文件、标注文档、使用说明,支持直接导入PyTorch、TensorFlow等框架。


雷达卡


京公网安备 11010802022788号







