欢迎光临,我们是一家专注中小型企业营销推广服务的公司!

咨询热线:400 9868 577
淮南兰乔电子商务有限公司
新闻中心News
淮南兰乔电子商务有限公司

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

作者:DDD | 点击: | 来源:DDD
2309
2025
阿里通义Qwen团队近日发布了其最新的旗舰级多语言、多音色文本转语音模型——Qwen3-TTS-Flash。该模型不仅支持多种语言和音色输出,还覆盖了包括普通话及闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话在内的9种汉语方言,展现出强大的语言适应能力。在性能表现上,Qwen3-TTS-Flash已在seed-tts-eval与MiniMax多语测试集中展现出卓越的语音稳定性与音色相似度,达到当前最先进的SOTA水平。同时,官方已同步推出API接口、在线Demo以及多段音频样例,方便...

阿里通义qwen团队近日发布了其最新的旗舰级多语言、多音色文本转语音模型——qwen3-tts-flash。该模型不仅支持多种语言和音色输出,还覆盖了包括普通话及闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话在内的9种汉语方言,展现出强大的语言适应能力。

在性能表现上,Qwen3-TTS-Flash已在seed-tts-eval与MiniMax多语测试集中展现出卓越的语音稳定性与音色相似度,达到当前最先进的SOTA水平。同时,官方已同步推出API接口、在线Demo以及多段音频样例,方便开发者和用户快

速体验。

据团队介绍,Qwen3-TTS-Flash在语音质量和一致性方面经过全面评测,在多项关键指标上均优于现有主流模型。

在seed-tts-eval测试集上的评估显示,Qwen3-TTS-Flash在中文和英文的语音稳定性方面均取得了最佳表现,明显优于SeedTTS、MiniMax以及GPT-4o-Audio-Preview等模型。

此外,在MiniMax多语言TTS测试集上,Qwen3-TTS-Flash在中文、英文、意大利语和法语的词错误率(WER)上均达到最低水平,显著优于MiniMax、ElevenLabs和GPT-4o-Audio-Preview。在说话人相似度方面,其在英文、意大利语和法语上的得分也全面领先,充分体现了其在多语言场景下的高质量合成能力。

作为一款统一架构的旗舰级语音合成模型,Qwen3-TTS-Flash支持17种不同音色,每种音色均可生成10种语言的语音内容。除中文方言外,模型还支持英式、美式及其他地区口音的英语,并涵盖法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语和韩语等多种国际语言。

功能层面,Qwen3-TTS-Flash具备自动语气调节、强鲁棒性的文本预处理机制以及跨语种混合生成能力,能够应对复杂多变的实际应用场景。在推理效率方面,该模型表现出色:单并发情况下首包延迟低至97ms,满并发时为420ms,实时因子(RTF)最低可达0.30,兼顾了高质与高效。

相关推荐
我要咨询做网站
成功案例
建站流程
  • 网站需
    求分析
  • 网站策
    划方案
  • 页面风
    格设计
  • 程序设
    计研发
  • 资料录
    入优化
  • 确认交
    付使用
  • 后续跟
    踪服务
  • 400 9868 577
    info#ilanqiao.cn
Hi,Are you ready?
准备好开始了吗?
那就与我们取得联系吧

咨询送礼现在提交,将获得兰乔电子商务策划专家免费为您制作
价值5880元《全网营销方案+优化视频教程》一份!
下单送礼感恩七周年,新老用户下单即送创业型空间+域名等大礼
24小时免费咨询热线400 9868 577
合作意向表
您需要的服务
您最关注的地方
预算

直接咨询