Meta 发布 SeamlessM4T AI 翻译模型
Meta 上上周还开源了SeamlessM4T,支持近100种语言的自动语音识别、语音到文本翻译、语音到语音翻译、文本到文本翻译和文本到语音翻译的多任务支持。
Meta 还发布了 SeamlessAlign 的元数据,这是迄今为止最大的开放式多模态翻译数据集之一,共挖掘了 27 万小时的语音和文本。
与当前最先进的模型相比,SeamlessM4T 系统在语音转文本任务中针对背景噪声和说话人变化的表现更好(平均分别提高了 37% 和 48%)。
论文:https://ai.meta.com/research/publications/seamless-m4t/
演示:https://seamless.metademolab.com/
模型和数据下载:https://github.com/facebookresearch/seamless_communication
© 版权声明
文章版权归作者所有,未经允许请勿转载。