楼主: ewfwedwd
12 0

[经管数据集] Free Spoken Digit Dataset 数字识别音频数据集_8kHz 采样率语音数据集 [推广有奖]

  • 0关注
  • 1粉丝

已卖:431份资源

学科带头人

18%

还不是VIP/贵宾

-

威望
0
论坛币
1323 个
通用积分
456.7553
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
13020 点
帖子
945
精华
0
在线时间
242 小时
注册时间
2022-11-18
最后登录
2026-3-6

楼主
ewfwedwd 发表于 2026-3-5 14:47:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

Free Spoken Digit Dataset 数字识别音频数据集_8kHz 采样率语音数据集



Free Spoken Digit DatasetFSDD)是一款适用于语音识别、数字识别相关研究与开发的开源音频语音数据集,数据集以 8kHz 采样率的 wav 格式文件为主,所有数字语音录音均经过专业裁剪,最大程度缩减开头与结尾的沉默时长,数据可用性高,且会随社区贡献持续更新扩充。



截至 2024 7 月,FSDD 数字识别音频数据集包含 6 位不同演讲者的纯英语发音录音,累计 3000 条有效语音数据,平均每位演讲者完成 500 条数字语音录制,数据量充足且维度统一,为相关算法训练、模型测试提供标准化数据支撑。



该数据集的文件命名遵循 **{digitLabel}{speakerName}{index}.wav** 固定格式,例如 7_jackson_32.wav,即代表演讲者 jackson 录制的数字 7 的第 32 个录音,文件命名逻辑清晰,便于研究人员快速检索、分类与使用。



FSDD 数据集适用途径

学术研究场景:可作为语音识别、数字音频识别、声纹特征分析等声学相关学科的研究实验数据集,支撑学术论文撰写、课题研究开展;

算法模型开发:适用于机器学习、深度学习领域的数字语音识别算法训练、模型验证与优化,为相关 AI 模型开发提供基础数据;

教学实训使用:可作为高校计算机、人工智能、声学工程等专业的教学实训数据,用于语音处理相关课程的实践教学。



FSDD 数据集社区贡献规范

FSDD 为开放式音频数据集,鼓励全球开发者、研究人员贡献自制数字语音录音,贡献的录音需满足单声道、8kHz 采样率、wav 文件格式,且需对录音进行裁剪,最小化沉默部分,保持与现有数据集的格式统一。




Free Spoken Digit Dataset (FSDD) 数字识别音频数据集.zip (1.42 KB, 需要: RMB 10 元)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:dataset Spoken DataS 数字识别 Free Free Spoken Digit Dataset;数字识别音频数据集;8kHz 采样率语音数据集;英文数字语音数据集;开源音频数据集

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-7 19:15