欢迎光临,我们是一家专注中小型企业营销推广服务的公司!

咨询热线:400 9868 577
淮南兰乔电子商务有限公司
新闻中心News
淮南兰乔电子商务有限公司

Meta AI 推出“全语种”语音识别系统,支持 1600+ 语言

作者:心靈之曲 | 点击: | 来源:心靈之曲
1111
2025
Meta的基础人工智能研究(FAIR)团队最近开源了一款名为OmnilingualASR的突破性自动语音识别系统,能够识别并转录超过1600种口语语言。该模型基于PyTorch构建的fairseq2框架开发,提供多个版本,参数规模从适用于低功耗设备的3亿参数模型,到追求极致精度的70亿参数大模型。这一发布旨在填补当前AI技术在语言支持方面的显著空白,推动实现“通用语音转录系统”的愿景。Meta强调,在其所覆盖的1600多种语言中,有约500种语言此前从未被任何AI系统所支持。在对1600种语言的...

meta的基础人工智能研究(fair)团队最近开源了一款名为omnilingual asr的突破性自动语音识别系统,能够识别并转录超过1600种口语语言。该模型基于pytorch构建的fairseq2框架开发,提供多个版本,参数规模从适用于低功耗设备的3亿参数模型,到追求极致精度的70亿参数大模型。

这一发布旨在填补当前AI技术在语言支持方面的显著空白,推动实现“通用语音转录系统”的愿景。Meta强调,在其所覆盖的1600多种语言中,有约500种语言此前从未被任何AI系统所支持。

  • 在对1600种语言的测试中,系统在78%的语言上实现了每百个字符错误率低于10的优异表现。
  • 针对拥有至少10小时标注音频的“高资源”语言,达到该准确度标准的比例高达95%。
  • 即便是在训练数据少于10小时的“低资源”语言中,仍有36%的语言满足这一误差阈值,为小语种用户提供了切实可用的语音识别能力。

Omnilingual ASR的一项核心创新是引入了“自带语言”(Bring Your Own Language)功能,灵感来源于大语言模型中的上下文学习机制。通过仅提供少量音频与对应文本的样本,用户即可让系统即时学会识别一种新语言,无需重新训练模型或依赖大量算力投入。

Meta指出,借助这一机制,理论上Omnilingual ASR未来可扩展至支持超过5400种语言,远超目前行业内的语言覆盖极限。

与此同时,Meta还推出了Omnilingual ASR Corpus——一个涵盖350种代表性不足语言的大规模转录语音语料库。该数据集采用知识共享署名许可(CC-BY)公开发布,旨在赋能全球开发者优化和定制语音识别模型,以更好地服务本地化应用场景。

相关推荐
我要咨询做网站
成功案例
建站流程
  • 网站需
    求分析
  • 网站策
    划方案
  • 页面风
    格设计
  • 程序设
    计研发
  • 资料录
    入优化
  • 确认交
    付使用
  • 后续跟
    踪服务
  • 400 9868 577
    info#ilanqiao.cn
Hi,Are you ready?
准备好开始了吗?
那就与我们取得联系吧

咨询送礼现在提交,将获得兰乔电子商务策划专家免费为您制作
价值5880元《全网营销方案+优化视频教程》一份!
下单送礼感恩七周年,新老用户下单即送创业型空间+域名等大礼
24小时免费咨询热线400 9868 577
合作意向表
您需要的服务
您最关注的地方
预算

直接咨询