OpenVoice:多功能实时语音克隆 My shell 的这个语音克隆技术上周爆了,只需要一小段说话内容就可以复制对应的声音并生成多种语言的声音。 除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。 OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。 论文:https://arxiv.org/pdf/2312.01479.pdf Github:https://github.com/myshell-ai/OpenVoice Mobile ALOHA:斯坦福家政机械臂
OpenVoice:多功能实时语音克隆
My shell 的这个语音克隆技术上周爆了,只需要一小段说话内容就可以复制对应的声音并生成多种语言的声音。
除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。
OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。
论文:https://arxiv.org/pdf/2312.01479.pdf
Github:https://github.com/myshell-ai/OpenVoice
© 版权声明
文章版权归作者所有,未经允许请勿转载。