澳门3044永利官网

最新发布!查看 MagicData 成品数据集
语音复刻大模型高品质数据集——东南亚

语音复刻大模型高品质数据集——东南亚

语种

他加禄语-菲律宾,马来语-马来西亚,泰语-泰国

数据风格

对话式&朗读式

音频格式

PCM

采样率

48kHz

比特率

16 bits

声道

1

人数

5,232

时长

2,425

As a new trend of AIGC, zero-shot speech synthesis has wide-ranging applications, including voice assistants, audiobooks, video game character voices, creating podcast, and real-time voice changer, among others. has proactively designed and developed the "High-Quality Dataset for Voice Replication," which boasts a 48kHz high sampling rate, tens of thousands of contributors with diverse content, making it an excellent resource for achieving zero-shot speech synthesis.

没有找到想要的数据?

联系我们

数据集推荐

MDT-AE018 菲律宾他加禄语朗读音频数据集—日常用语

试听音频

MDT-AE038 土耳其英语朗读音频数据集—日常用语

试听音频

MDT-RJ003 韩语高质量口语式语音数据集

该数据集专为训练更懂口语表达的AI模型打造,有利于提升韩语语音识别的自然交互能力,覆盖多场景真实对话,由多样化人群录制,字准率高。严格标注收音连音变化现象,文本与发音高度对齐。完整句子结构展现口语语序特点,标点设计符合韩语情感表达习惯,强化模型对终结词尾情感意图的捕捉能力。

MDT-AF046 埃及阿拉伯语对话音频数据集

【开源数据】
试听音频

MDT-AF024 菲律宾英语朗读音频数据集—唤醒词

试听音频

MDT-RI002 粤语高质量口语式语音数据集

该数据集专为训练更懂口语表达的AI模型打造,有利于提升粤语语音识别的自然交互能力,覆盖多场景真实对话,由多样化人群录制,字准率高。针对粤语九声调、懒音、俚语等特性优化标注,严格保证音字匹配质量。完整语句结构与符合口语习惯的标点设计,帮助模型精准捕捉粤语特有的停顿节奏和语气词用法,攻克方言识别中的泛化瓶颈。

数据优势有哪些?

合规性

符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证

多维度

音频、文本、图像、音视频多模态数据

覆盖性

涵盖多领域的对话式、朗读式及自发式数据

高精度

人机协同高精度标注

TOP
联系我们
Sitemap