LAION-SG 图像理解数据集 2024 大规模场景图 - 图像对 跨模态研究数据集下载
LAION-SG 大规模高质量图像理解数据集是 2024 年由浙江大学、江南大学、北京大学、阿里巴巴集团、蚂蚁集团联合构建的专业数据集,相关论文成果为「LAION-SG: An Enhanced Large-Scale Dataset for Training Complex Image-Text Models with Structural Annotations」,是适配复杂图文模型训练的优质结构注释数据集。
本 LAION-SG 图像理解数据集包含540,005 个带对象、属性和关系注释的场景图 - 图像对,所有数据严格划分为训练集、验证集、测试集,数据集图像源为 LAION-Aesthetics V2 (6.5+) 数据集,注释环节通过 GPT-4o 实现自动化注释,保障注释的精准性与高效性。
相较于原始 LAION-Aesthetics 数据集,LAION-SG 大规模数据集的平均注释长度、注释准确性均大幅提升,样本平均包含 6.39 个对象,对象信息直接增加 20%;若排除抽象专有名词,对象信息优势提升至 216%,数据丰富度与实用性显著增强。
LAION-SG 数据集内容覆盖
基础数据:540,005 个场景图 - 图像对,含完整的对象、属性、关系结构化注释;
数据划分:标准训练集、验证集、测试集,满足模型训练全流程使用;
注释信息:GPT-4o 自动化标注的精准语义信息,覆盖多场景对象关联与属性描述。
LAION-SG 数据集可用途径
LAION-SG 图像理解数据集适用于图像与文本跨模态研究全领域,核心应用场景包含:
图像描述生成模型的训练与优化;
视觉问答系统(VQA)的研发与测试;
图像检索任务的算法验证与模型训练;
各类复杂图像 - 文本跨模态模型的结构化训练,助力图像内容的深入理解与语义解析。
LAION-SG 大规模高质量图像理解数据集.zip
(2.79 KB, 需要: RMB 10 元)


雷达卡


京公网安备 11010802022788号







