BSTC 全称 Baidu Speech Translation Corpus,是一个大型自动同声传译数据集, 用于自动同声传译系统的构建。
该语料库分为训练集、开发集和测试集 3 个子集,每个子集包括:
-声音信号文件,命名为 baidu_XX.wav
-描述文件,包括每个声音信号的描述信息,每个语句由 JSON 格式编码
-补充文档,包括演讲和报告的详细介绍
|
楼主: Lyon0898
|
21
0
CCMT 2019-BSTC 语音翻译语料库 |
|
已卖:4910份资源 院士 45%
-
|
| ||
|
|
扫码京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


