项目简介
欢迎使用 VoiceFixer 2,下一代 VoiceFixer。VoiceFixer 是一款通用语音修复工具,使用 AI 消除背景噪音、修复降级语音、增强旧录音的音频质量、提高音频分辨率等等,全部功能都在一个模型中!
VoiceFixer 的目标是恢复人类语音,无论其退化有多严重。它可以在一个模型内处理噪声、混响、低分辨率和削波效果!
与原来的 VoiceFixer 有什么不同?
VoiceFixer 的原始版本继续更新,进行了细微的更改和错误修复,但是,如果尝试安装它并开箱即用,则会遇到一些错误,需要修改已安装的软件包才能修复。
有什么问题?这是如何解决的?VoiceFixer 需要旧版本的 librosa
库,该库与新版本的 numpy
库不兼容。我们通过修复旧版本的 librosa
和 voicefixer
解决了这个问题。我们还添加了一些新功能。
VoiceFixer 2 中的新功能
我们在 VoiceFixer 2 中添加了以下功能:
- 我们添加了 MPS 支持,这意味着您可以在 M1 Mac 上使用 GPU 加速。您可以通过将
cuda
参数设置为True
来启用此功能。使用命令行界面 (CLI) 时会自动启用它。 - 我们通过 TQDM 添加了进度条以获取更长的音频
- 我们现在支持非 WAV 文件(即 MP3)
- 我们现在使用
cached_path
而不是硬编码缓存路径来增加操作系统支持 - 我们提供更快的模型下载和 Hugging Face
- 更多功能即将推出!
安装
不想安装该软件包,但只想尝试一下?
使用我们的免费 API(无需 API 密钥)处理 5 分钟以内的音频文件。仅限非商业用途,可能会收集音频。详情见网页。
curl -X POST -H "Content-Type: multipart/form-data" -F "file=@test.mp3" https://voicefixer-voicefixer-api.hf.space/process_audio > processed_audio.wav
注意:如果您在 Apple Silicon 上有任何问题,请安装 PyTorch Nightly ( pip install –pre torch torchvision torchaudio –index-url https://download.pytorch.org/whl/nightly/cpu )
您可以通过安装我们的软件包。PyPI(Python Package Index),官方 Python 包索引。
pip install voicefixer2
这将安装最新发布的版本。
如果您想安装最新的开发版本,或者出于任何原因不信任 PyPI,请直接从源安装:
pip install git+https://github.com/fakerybakery/voicefixer
项目链接
https://github.com/voicefixer/voicefixer