人大经济论坛 › 论坛 › 提问悬赏求职新闻读书功能一区 › 经管文库（原现金交易版） › 百度 WebQA v1.0 数据集中文问答训练数据人工标注 (AN ...

发帖

楼主: ewfwedwd

74 0

[经管数据集] 百度 WebQA v1.0 数据集中文问答训练数据人工标注 (ANN)+ 浏览器检索 (IR) 格式 [推广有奖]

0关注
1粉丝

已卖：442份资源

学科带头人

29%

还不是VIP/贵宾

威望: 0 级
论坛币: 1343 个
通用积分: 456.9353
学术水平: 1 点
热心指数: 1 点
信用等级: 1 点
经验: 13530 点
帖子: 996
精华: 0
在线时间: 275 小时
注册时间: 2022-11-18
最后登录: 2026-4-13

楼主

ewfwedwd 发表于 2026-1-21 14:35:57 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

百度 WebQA v1.0 数据集中文问答训练数据人工标注 (ANN)+ 浏览器检索 (IR) 格式

核心信息

百度 WebQA v1.0 中文问答数据集是 2016 年百度官方开源的优质中文问答训练资源，数据均来源于百度知道平台，采用 “一个问题 + 多篇意思一致文章” 的结构化格式，适配中文 NLP 模型训练、问答系统开发等场景。

内容覆盖范围

数据类型：中文问答成对数据（问题 + 关联文章）

标注分类：文章分为人工标注（ANN）、浏览器检索（IR）两类；答案分为可回答（positive）、不可回答（other_negative）两类

数据特点：覆盖多领域日常问答场景，结构化程度高，兼顾人工筛选与广泛检索数据，适配不同模型训练需求

可用途径

中文 NLP 模型训练（问答匹配、意图识别、答案抽取等任务）

智能问答系统开发（客服机器人、智能助手训练）

学术研究数据支撑（中文问答领域论文实验、算法验证）

教育 / 企业内部问答知识库构建

WebQA v1.0 百度中文问答数据集.zip (4.78 KB, 需要: RMB 10 元)

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：WEB 数据集 negative positive Other

返回列表

发帖

本版微信群

扫码
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[经管数据集] 百度 WebQA v1.0 数据集中文问答训练数据人工标注 (ANN)+ 浏览器检索 (IR) 格式 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

浏览过的帖子

浏览过的版块

本版微信群

[经管数据集] 百度 WebQA v1.0 数据集 中文问答训练数据 人工标注 (ANN)+ 浏览器检索 (IR) 格式 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

浏览过的帖子

浏览过的版块

本版微信群

[经管数据集] 百度 WebQA v1.0 数据集中文问答训练数据人工标注 (ANN)+ 浏览器检索 (IR) 格式 [推广有奖]

扫码加我拉你入群