Multimodal Coding Dataset(MCD)是由微软研究院、北京大学和南方科技大学提出并于 2025 年发布的一个大规模数据集,相关论文成果为「VisCodex: Unified Multimodal Code Generation via Merging Vision and Coding Models」。
该数据集包含总计约 59.8 万条/对高质量样本,以指令跟随格式组织,覆盖多种输入模态(文本、图像、代码)与输出模态(代码、答案、解释),适用于多模态代码理解与生成任务。
|
楼主: Lyon0898
|
110
0
MCD 多模态代码生成数据集 |
|
已卖:4911份资源 院士 45%
-
|
| ||
|
|
扫码京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


