2024 最新 TransGPT 交通对话预训练数据集 - 34.6 万文本 + 5.8 万对话数据
【核心资源】北京交通大学 2024 年重磅发布国内首款综合交通大模型 TransGPT 配套数据集 ——TransGPT-pt&sft 交通对话预训练数据集,是交通领域模型训练的核心优质资源!
【数据规模】包含约 34.6 万条交通领域专业文本数据(适用于领域内模型预训练),以及约 5.8 万条交通领域真实对话数据(适用于模型微调优化),数据量充足、场景贴合实际需求。
【数据来源】涵盖单模态与多模态数据,具体包括交通标志大全、驾考题库、全球旅游景点相关交通信息等,数据来源权威、覆盖全面。
【覆盖范围】全方位覆盖交通相关核心行业及场景:道路工程、桥梁工程、隧道工程、公路运输、水路运输、城市公共交通运输、交通运输经济、交通运输安全等,提供专业且全面的交通通识常识,满足多场景模型训练需求。
【可用途径】
交通大模型预训练、微调开发;
交通领域 AI 对话系统搭建;
交通行业数据分析、研究支撑;
交通相关 APP、平台功能优化;
高校、科研机构交通领域学术研究与实验。
【关联成果】配套论文成果「TransGPT: 多模态生成式预训练交通 Transformer」,资源权威性与专业性有强力支撑,是交通领域从业者、研究者、开发者的必备数据资源!
TransGPT-pt&sft 交通对话预训练数据集.zip
(1.37 KB, 需要: RMB 12 元)


雷达卡


京公网安备 11010802022788号







