项目简介
此脚本采用 epub(或文本文件)并将其读取为 mp3 或 m4b 有声读物文件,使用 TTS(https://github.com/coqui-ai/TTS)
我认识到这不是很用户友好,但我想分享以防人们认为它有用。如果有比我更多的人发现这很有用,我将继续努力将其变成可供没有开发经验的人使用的东西。
注意:现在支持 OpenAI TTS!它不是免费的,但我测试过的几本书的平均成本约为 7 美元。如果您使用 --openai <API key>
标志,epub2tts 将提供成本估算并提示您批准后再继续。
注意:非常感谢 wonka929 最近的 PR,epub2tts 现在可以识别 CUDA GPU 何时可用并自动使用它。在我所做的一个简短测试中,加速效果令人难以置信!
用法
EPUB:epub2tts my-book.epub
文本:epub2tts my-book.txt
网址:epub2tts –url https://www.example.com/page –name example-page
要使用 Coqui XTTS,请添加: –xtts <sample.wav> (绝对需要 GPU,即使这样,速度很慢,但听起来很棒!)
要使用 OpenAI TTS,请添加: –openai <your API key> (使用扬声器选项指定除 onyx 之外的语音: –speaker shimmer )
要更改扬声器(例如 p307 以获得良好的男声),请添加: –speaker p307
要以 mp3 格式而不是 m4b 输出,请添加: –mp3
要跳过阅读任何链接,请添加: –skip-links
使用 –scan 将列出每章的摘录,然后退出。如果您想跳过参考书目、目录等,这有助于查找从哪一章开始和结束。
要指定从哪一章开始(例如 3): –start 3
要指定结束于哪一章(例如 20): –end 20
要指定比特率(例如 30k): –bitrate 30k
如果 epub2tts 中断或崩溃,您可以使用相同的参数再次运行它,它会从上次中断的地方继续运行,假设它已经足够保存一些 WAV 文件了。如果您想重新开始,请务必在再次运行之前删除工作目录中的任何 wav 文件(与 epub 同名)。
DOCKER指令
语音模型将保存在本地 ~/.local/share/tts 中
对于 Linux 和 MacOS:
alias epub2tts='docker run -v "$PWD:$PWD" -v ~/.local/share/tts:/root/.local/share/tts -w "$PWD" ghcr.io/aedocw/epub2tts:release'
对于 Windows:先决条件:
- 安装 Docker 桌面
- 从 PowerShell 运行“mkdir ~/.local/share/tts”
#Example for running scan of "mybook.epub"
docker run -v ${PWD}/.local/share/tts:/root/.local/share/tts -v ${PWD}:/root -w /root ghcr.io/aedocw/epub2tts:release mybook.epub --scan
#Example for reading parts 3 through 15 of "mybook.epub"
docker run -v ${PWD}/.local/share/tts:/root/.local/share/tts -v ${PWD}:/root -w /root ghcr.io/aedocw/epub2tts:release mybook.epub --start 3 --end 15
项目链接
https://github.com/aedocw/epub2tts