将epub或文本文件转换成有声读物epub2tts

工具软件3年前 (2023)发布 AI观察员

561 0 0

项目简介

此脚本采用 epub（或文本文件）并将其读取为 mp3 或 m4b 有声读物文件，使用 TTS（https://github.com/coqui-ai/TTS）

我认识到这不是很用户友好，但我想分享以防人们认为它有用。如果有比我更多的人发现这很有用，我将继续努力将其变成可供没有开发经验的人使用的东西。

注意：现在支持 OpenAI TTS！它不是免费的，但我测试过的几本书的平均成本约为 7 美元。如果您使用 --openai <API key> 标志，epub2tts 将提供成本估算并提示您批准后再继续。

注意：非常感谢 wonka929 最近的 PR，epub2tts 现在可以识别 CUDA GPU 何时可用并自动使用它。在我所做的一个简短测试中，加速效果令人难以置信！

用法

EPUB：epub2tts my-book.epub

文本：epub2tts my-book.txt

网址：epub2tts –url https://www.example.com/page –name example-page

要使用 Coqui XTTS，请添加： –xtts <sample.wav> （绝对需要 GPU，即使这样，速度很慢，但听起来很棒！）

要使用 OpenAI TTS，请添加： –openai <your API key> （使用扬声器选项指定除 onyx 之外的语音： –speaker shimmer ）

要更改扬声器（例如 p307 以获得良好的男声），请添加： –speaker p307

要以 mp3 格式而不是 m4b 输出，请添加： –mp3

要跳过阅读任何链接，请添加： –skip-links

使用 –scan 将列出每章的摘录，然后退出。如果您想跳过参考书目、目录等，这有助于查找从哪一章开始和结束。

要指定从哪一章开始（例如 3）： –start 3

要指定结束于哪一章（例如 20）： –end 20

要指定比特率（例如 30k）： –bitrate 30k

如果 epub2tts 中断或崩溃，您可以使用相同的参数再次运行它，它会从上次中断的地方继续运行，假设它已经足够保存一些 WAV 文件了。如果您想重新开始，请务必在再次运行之前删除工作目录中的任何 wav 文件（与 epub 同名）。

DOCKER指令

语音模型将保存在本地 ~/.local/share/tts 中

对于 Linux 和 MacOS：

alias epub2tts='docker run -v "$PWD:$PWD" -v ~/.local/share/tts:/root/.local/share/tts -w "$PWD" ghcr.io/aedocw/epub2tts:release'

对于 Windows：先决条件：

安装 Docker 桌面
从 PowerShell 运行“mkdir ~/.local/share/tts”

#Example for running scan of "mybook.epub"docker run -v ${PWD}/.local/share/tts:/root/.local/share/tts -v ${PWD}:/root -w /root ghcr.io/aedocw/epub2tts:release mybook.epub --scan
#Example for reading parts 3 through 15 of "mybook.epub"docker run -v ${PWD}/.local/share/tts:/root/.local/share/tts -v ${PWD}:/root -w /root ghcr.io/aedocw/epub2tts:release mybook.epub --start 3 --end 15