Yahoo! 问答数据集 448 万 + 问题答案语料库 康奈尔大学发布 SEO 优化资源
Yahoo! 问答数据集 康奈尔大学官方发布 448 万 + 问题答案语料 10 大分类训练测试样本
内容覆盖范围
数据来源:源自 Yahoo! Answers Comprehensive Questions and Answers 1.0,由康奈尔大学发布
时间跨度:截至 2007 年 10 月 25 日的优质答案语料库
数据规模:包含 4483032 个问题及对应答案,附带少量元数据(支持最佳答案筛选)
分类结构:10 个主要分类,每类含 140000 个训练样本 + 5000 个测试样本,分类清晰、样本均衡
可用途径
自然语言处理(NLP)模型训练、问答系统开发
文本挖掘、语义分析、意图识别研究
教育科研、算法优化、AI 项目数据支撑
SEO 算法研究、问答类内容创作参考
适配说明
数据格式规范,样本量充足,适用于科研机构、企业技术团队、AI 开发者等场景,满足各类问答相关研究与应用需求,检索关键词精准匹配,便于平台收录推荐。
雅虎!问答数据集.zip
(4.08 KB, 需要: RMB 10 元)


雷达卡


京公网安备 11010802022788号







