楼主: Lyon0898
161 0

MLDR 多语言文档检索数据集 [推广有奖]

  • 0关注
  • 7粉丝

已卖:4912份资源

院士

47%

还不是VIP/贵宾

-

威望
0
论坛币
146702 个
通用积分
15193.7797
学术水平
55 点
热心指数
57 点
信用等级
55 点
经验
46683 点
帖子
1903
精华
0
在线时间
446 小时
注册时间
2022-3-14
最后登录
2026-2-10

楼主
Lyon0898 在职认证  发表于 2025-10-31 18:02:34 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

MLDR(Multilingual Long-Document Retrieval)是一个基于维基百科(Wikipedia)、悟道数据集(Wudao)和 mC4 多语言语料库,构建的多语言长文档检索数据集,旨在支持跨语言长文本检索任务的研究与开发。涵盖 13 种类型学上不同的语言,包括阿拉伯语(ar)、德语(de)、英语(en)、西班牙语(es)、法语(fr)、印地语(hi)、意大利语(it)、日语(ja)、韩语(ko)、葡萄牙语(pt)、俄语(ru)、泰语(th)、中文(zh)。

特点优势:多语言覆盖广:包含 13 种语言,覆盖多种语系(如印欧语系、汉藏语系、阿拉伯语系等)。长文档特性:文档平均长度达 4,737 词,适用于真实场景中长文本处理需求。标准化构建:通过 GPT-3.5 生成高质量查询,确保查询与文档内容的强相关性。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 Multilingual Retrieval Wikipedia Document

MLDR.rar
下载链接: https://bbs.pinggu.org/a-8586047.html

93.89 KB

需要: 201 个论坛币  [购买]

磁力链接,9.3G

本附件包括:

  • MLDR.torrent

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-10 22:11