[经管数据集] VEGA 科学论文图文数据理解数据集 [推广有奖]

0关注
1粉丝

已卖：429份资源

学科带头人

17%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 1323 个
通用积分: 456.7553
学术水平: 1 点
热心指数: 1 点
信用等级: 1 点
经验: 12970 点
帖子: 940
精华: 0
在线时间: 240 小时
注册时间: 2022-11-18
最后登录: 2026-3-4

楼主

ewfwedwd 发表于 2026-1-5 14:47:43 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

VEGA 科学论文图文数据理解数据集

VEGA 是一个专注于科学论文理解的多模态数据集，它由厦门大学纪荣嵘团队于 2024 年提出，并被设计用于评估和提升模型在处理包含复杂图文交错信息的输入时的表现，相关论文为「VEGA : Learning Interleaved Image-Text Comprehension in Vision-Language Large Models」。

该数据集包含超过 50,000 篇科学论文的图文数据，并且特别为交错图文阅读理解（Interleaved Image-Text Comprehension, IITC）任务而构建。 VEGA 数据集的构建过程包括问题筛选、上下文构建和答案修改三个步骤，旨在提供更长、更复杂的图文交错内容作为输入，并要求模型在回答时指明参考的图片

VEGA 源自 SciGraphQA 数据集，后者是一个论文图片理解任务的数据集，包含 295k 个问答对，研究团队在其基础上进行了问题筛选、上下文构建、答案修改三个步骤，得到 VEGA 数据集。包含 593,000 条论文类型训练数据，2 个不同任务的 2,326 条测试数据，旨在提供更长、更复杂的图文交错内容作为输入，并要求模型在回答时指明参考的图片。