2024 最新 PubMedVision 大规模医学 VQA 数据集下载_130 万医疗多模态样本
PubMedVision 是 2024 年由深圳市大数据研究院、香港中文大学及 National Health Data Institute 联合打造的大规模高质量医疗多模态数据集,核心包含 130 万个医学 VQA(视觉问答)样本,相关论文成果为《HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale》。
数据核心优势:
来源权威:筛选自 PubMed 国际医学期刊,精准过滤医疗无关图片及无效上下文,确保数据专业性;
对齐精准:采用 GPT-4V 视觉大模型重新描述图片,实现图文高度匹配,提升数据可用性;
场景丰富:构建 10 大医疗核心场景对话,将图文数据转化为问答形式,强化医疗视觉知识学习效率。
适用范围:
适用人群:多模态 LLM 研发人员、医疗 AI 算法工程师、医学 AI 科研人员、高校相关专业师生;
核心用途:医疗视觉知识注入、多模态大模型训练优化、医学 VQA 任务开发、医疗 AI 相关论文研究;
资料下载:
PubMedVision 大规模医学 VQA 数据集.zip
(536.88 KB, 需要: RMB 10 元)


雷达卡


京公网安备 11010802022788号







