开放下载丨超自然对话语音合成数据集NCSSD

19 阅读 0 评论 0 点赞

内蒙古大学S2LAB 刘瑞研究员 联合字节跳动、香港中文大学（深圳）等单位推出了涵盖中英双语、超过236小时的超自然对话语音合成数据集——NCSSD，并在GitHub平台开源了搜集子集的数据构建Pipeline，在Hugging Face平台开放了数据下载页面。

您可以通过以下链接免费下载并立即开始使用：

NCSSD数据集简介：

NCSSD 数据集统计

GPT-Talker模型结构图

NCSSD数据集构建过程

通过NCSSD数据集，研究者和开发者可以进行大规模语音合成模型的训练和开发，为多语言环境下的语音应用提供强有力的支持！期待大家在使用NCSSD数据集时能够发掘更多惊喜，欢迎分享您的研究成果与经验！

请注意：该数据集仅可用于非商业科研目的，S2LAB团队不拥有搜集子集部分(CL-ZH和CL-EN)音频文件的版权，版权仍归原始视频或者音频的所有者。想把该数据集及Pipeline用于商业用途，请联系S2LAB团队。

联系我们：liurui_imu @163.com, hyfwalker@163.com

内蒙古大学语音理解与生成实验室 S2LAB：https://ttslr.github.io/

本站资源均来自互联网，仅供研究学习，禁止违法使用和商用，产生法律纠纷本站概不负责！如果侵犯了您的权益请与我们联系！

点赞(0) 打赏

暂无评论