2024 多模光谱化学数据集下载_79 万分子 NMR / 红外 / 质谱多模态数据 + AI/ML 模型训练基准
一、数据集核心信息
多模光谱化学数据集由 IBM 研究、苏黎世大学、EPFL 及 NCCR 催化研究中心联合打造(2024 年发布),相关论文《揭示分子结构:面向化学的多模光谱数据集》已被 NeurIPS 收录,权威性与学术价值突出。
二、数据集覆盖范围
包含从专利化学反应中提取的 79 万种分子的全维度光谱数据,覆盖五大核心模态:
核磁共振光谱:1H-NMR、13C-NMR、HSQC-NMR
红外光谱
质谱:正负离子模式光谱数据数据来源权威、样本量充足,可全面支撑多场景化学研究需求。
三、核心价值与可用途径
多模态信息整合:模拟人类专家分子结构分析逻辑,助力自动化结构解析,大幅简化分子发现流程(从合成到结构确定)。
技术互补优势:融合 NMR、红外、质谱等技术的互补视角,精准呈现官能团存在状态,为分子结构研究提供深度支撑。
AI/ML 模型开发:适配多模态信息整合类 AI/ML 模型训练,解决化学领域多源光谱数据融合难题。
基准测试支撑:提供结构解析、目标分子光谱预测、官能团预测等单一模态任务评估基准,助力模型性能验证与优化,明确研究方向。
四、适用人群
化学领域科研人员、高校师生、AI + 化学交叉学科研究者、生物医药研发从业者、光谱分析相关工程师等
多模光谱化学数据集.zip
(97.92 KB, 需要: RMB 10 元)


雷达卡


京公网安备 11010802022788号







