楼主: ewfwedwd
16 0

[经管数据集] VEGA 科学论文图文数据理解数据集 [推广有奖]

  • 0关注
  • 1粉丝

已卖:416份资源

学科带头人

2%

还不是VIP/贵宾

-

威望
0
论坛币
1313 个
通用积分
456.6953
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
10220 点
帖子
865
精华
0
在线时间
205 小时
注册时间
2022-11-18
最后登录
2026-1-7

楼主
ewfwedwd 发表于 2026-1-5 14:47:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

VEGA 科学论文图文数据理解数据集



VEGA 是一个专注于科学论文理解的多模态数据集,它由厦门大学纪荣嵘团队于 2024 年提出,并被设计用于评估和提升模型在处理包含复杂图文交错信息的输入时的表现,相关论文为「VEGA : Learning Interleaved Image-Text Comprehension in Vision-Language Large Models」。

该数据集包含超过 50,000 篇科学论文的图文数据,并且特别为交错图文阅读理解(Interleaved Image-Text Comprehension, IITC)任务而构建。 VEGA 数据集的构建过程包括问题筛选、上下文构建和答案修改三个步骤,旨在提供更长、更复杂的图文交错内容作为输入,并要求模型在回答时指明参考的图片



VEGA 源自 SciGraphQA 数据集,后者是一个论文图片理解任务的数据集,包含 295k 个问答对,研究团队在其基础上进行了问题筛选、上下文构建、答案修改三个步骤,得到 VEGA 数据集。包含 593,000 条论文类型训练数据,2 个不同任务的 2,326 条测试数据,旨在提供更长、更复杂的图文交错内容作为输入,并要求模型在回答时指明参考的图片。



--问题筛选:原数据集中部分问题缺乏明确的图片指向,当将输入的信息拓展到多图时会造成理解的混淆。


--上下文构建:原数据集中问答仅针对一张图片,且提供的上下文信息较少。为了拓展文本和图片的数量,研究团队在 arxiv 上下载了相关论文的源文件,并构建了 4k token 8k token 两个长度的数据,每个问答对包含至多 8 张图片。


--答案修改:作者修改了原数据集中的答案,指明了回答时参考的图片,以符合 IITC 任务的要求。


7b1d658e-c08e-4e04-952f-d0062d064407.png



VEGA 科学论文图文数据理解数据集.zip (453.6 KB, 需要: RMB 10 元)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:VEGA 数据集 Language Learning earning

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 23:40