北京车展魏牌展台气场拉满小米开源OmniVoice多语言语音克隆TTS模型,号称搞定600余种语言_蜘蛛资讯网
语种的测试中,其语音相似度和可懂度均超越多款商用系统;在 102 种语种的测试中,它的语音可懂度逼近甚至优于真实语音;即便对于训练数据不足 10 小时的小语种,OmniVoice 也能实现高质量的语音合成,大大降低了低资源语种的语音合成门槛。该模型还具备多项实用功能:自定义音色设计:无需参考音频,只需描述音色属性(如性别、年龄、音调、方言、口音等),就能生成符合预期的音色,还支持耳语等特殊风格。 当前文章:http://8o7.taolubao.cn/m6kkz1j/gkr52.html 发布时间:04:30:42 |

