楼主: ewfwedwd
10 0

[经管数据集] GTSinger 歌声音频数据集 [推广有奖]

  • 0关注
  • 1粉丝

已卖:428份资源

学科带头人

17%

还不是VIP/贵宾

-

威望
0
论坛币
1323 个
通用积分
456.7553
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
12930 点
帖子
936
精华
0
在线时间
239 小时
注册时间
2022-11-18
最后登录
2026-3-2

楼主
ewfwedwd 发表于 11 小时前 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

GTSinger 歌声音频数据集



该数据集是由浙江大学的研究团队于 2024 年发布的全球化、多技巧的大型开源高质量歌声数据集,相关论文成果为「GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks」,已被 NeurIPS 2024 Datasets and Benchmarks Track 接收为 Spotlight



数据集包含了 80.59 小时的专业录音棚录制的歌声,这些歌声由 20 位专业歌手演唱,覆盖了 9 种不同的语言,包括汉语、英语、日语、韩语等,为研究者提供了一个音色和风格极为丰富的资源库。特别值得一提的是,GTSinger 在设计时特别关注了歌唱技巧的控制和建模,提供了 6 种常用歌唱技巧的对照组和音素级标注,这使得它在歌声合成、技巧识别等任务上具有独特的优势。



GTSinger 的另一个显著特点是它提供了与歌声相匹配的真实乐谱,这在实际音乐创作中非常有用,因为它与 MIDI 等精细乐谱不同,更接近于实际的作曲过程。数据集的结构设计得非常清晰,每个顶级文件夹对应不同的语言,每个语言文件夹下又细分为 5 个子文件夹,分别代表特定的歌唱技巧。此外,GTSinger 的音频质量非常高,所有的歌声和语音都以 48kHz 的采样率和 24 位的分辨率录制于 WAV 格式,并且提供了详细的 TextGrid 文件中的对齐和标注信息。



GTSinger 数据集不仅在数据规模和质量上表现出色,它还支持多种歌声任务,包括歌声合成、技巧识别、风格迁移和语音到歌声的转换,可以适配多任务。


46a6555e-545a-4314-be30-d5badc54e023.png




GTSinger 歌声音频数据集.zip (290.73 KB, 需要: RMB 10 元)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Singer ING GTS GER 数据集

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-2 22:43