[经管数据集] FineReason 多模态视觉推理数据集 [推广有奖]

0关注
1粉丝

已卖：428份资源

学科带头人

16%

还不是VIP/贵宾

威望: 0 级
论坛币: 1323 个
通用积分: 456.7553
学术水平: 1 点
热心指数: 1 点
信用等级: 1 点
经验: 12910 点
帖子: 934
精华: 0
在线时间: 238 小时
注册时间: 2022-11-18
最后登录: 2026-2-28

楼主

ewfwedwd 发表于 2025-12-31 14:17:03 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

FineReason 多模态视觉推理数据集

FineReason 是由 OpenDataArena 于 2025 年发布的一个面向大型多模态模型（LMMs）视觉推理能力训练与评测的数据集，旨在提升模型在视觉谜题、游戏、复杂图表推理、 STEM（科学，技术，工程和数学）知识应用等场景中的可解释、可检验的长链条推理能力。

该数据集涵盖几何题（geometry3k / geo170k）、图示与流程图理解（AI2D）、视觉推理及观察类谜题（visualwebinstruct 等）等多种任务类型。所有样本均采用统一数据格式，包含唯一编号、问题文本、对应图像以及推理式答案。数据集由多个公开子集整合而成，并通过 Qwen3-VL-235B-a22B-thinking 模型进行推理链条蒸馏，使样本均具备结构清晰、可检验的逐步推理过程及最终解答。

数据构成（持续扩展中）：

BMMR：42,647 条

Euclid30K：27,111 条

ai2d_merged：2,446 条

geo170k（问答）：12,101 条

geometry3k / mathv360k：9,724 条

ScienceQA：6,146 条

TQA（TextbookQA）：12,565 条

VisualWebInstruct（过滤后）：261,436 条

MMR1：1,000 条

VisualSphinx：3,781 条

MMOpenR1-8K：7,428 条