楼主: ewfwedwd
13 0

[经管数据集] 百度 WebQA v1.0 数据集 中文问答训练数据 人工标注 (ANN)+ 浏览器检索 (IR) 格式 [推广有奖]

  • 0关注
  • 1粉丝

已卖:423份资源

学科带头人

7%

还不是VIP/贵宾

-

威望
0
论坛币
1313 个
通用积分
456.6953
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
12430 点
帖子
886
精华
0
在线时间
214 小时
注册时间
2022-11-18
最后登录
2026-1-21

楼主
ewfwedwd 发表于 昨天 14:35 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

百度 WebQA v1.0 数据集 中文问答训练数据 人工标注 (ANN)+ 浏览器检索 (IR) 格式



核心信息

百度 WebQA v1.0 中文问答数据集是 2016 年百度官方开源的优质中文问答训练资源,数据均来源于百度知道平台,采用 一个问题 + 多篇意思一致文章的结构化格式,适配中文 NLP 模型训练、问答系统开发等场景。



内容覆盖范围

数据类型:中文问答成对数据(问题 + 关联文章)

标注分类:文章分为人工标注(ANN)、浏览器检索(IR)两类;答案分为可回答(positive)、不可回答(other_negative)两类

数据特点:覆盖多领域日常问答场景,结构化程度高,兼顾人工筛选与广泛检索数据,适配不同模型训练需求



可用途径

中文 NLP 模型训练(问答匹配、意图识别、答案抽取等任务)

智能问答系统开发(客服机器人、智能助手训练)

学术研究数据支撑(中文问答领域论文实验、算法验证)

教育 / 企业内部问答知识库构建



WebQA v1.0 百度中文问答数据集.zip (4.78 KB, 需要: RMB 10 元)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:WEB 数据集 negative positive Other

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-22 07:00