epub2tts:将epub或文本文件转换成有声读物

此脚本采用 epub(或文本文件)并将其读取为 mp3 或 m4b 有声读物文件,使用 TTS(https://github.com/coqui-ai/TTS)

来源丨 GitHubStore

我认识到这不是很用户友好,但我想分享以防人们认为它有用。如果有比我更多的人发现这很有用,我将继续努力将其变成可供没有开发经验的人使用的东西。

注意:现在支持 OpenAI TTS!它不是免费的,但我测试过的几本书的平均成本约为 7 美元。如果您使用 --openai  标志,epub2tts 将提供成本估算并提示您批准后再继续。

注意:非常感谢 wonka929 最近的 PR,epub2tts 现在可以识别 CUDA GPU 何时可用并自动使用它。在我所做的一个简短测试中,加速效果令人难以置信!

用法

EPUB:epub2tts my-book.epub

文本:epub2tts my-book.txt

网址:epub2tts --url https://www.example.com/page --name example-page

要使用 Coqui XTTS,请添加: --xtts  (绝对需要 GPU,即使这样,速度很慢,但听起来很棒!)

要使用 OpenAI TTS,请添加: --openai  (使用扬声器选项指定除 onyx 之外的语音: --speaker shimmer )

要更改扬声器(例如 p307 以获得良好的男声),请添加: --speaker p307

要以 mp3 格式而不是 m4b 输出,请添加: --mp3

要跳过阅读任何链接,请添加: --skip-links

使用 --scan 将列出每章的摘录,然后退出。如果您想跳过参考书目、目录等,这有助于查找从哪一章开始和结束。

要指定从哪一章开始(例如 3): --start 3

要指定结束于哪一章(例如 20): --end 20

要指定比特率(例如 30k): --bitrate 30k

如果 epub2tts 中断或崩溃,您可以使用相同的参数再次运行它,它会从上次中断的地方继续运行,假设它已经足够保存一些 WAV 文件了。如果您想重新开始,请务必在再次运行之前删除工作目录中的任何 wav 文件(与 epub 同名)。

DOCKER指令

语音模型将保存在本地 ~/.local/share/tts 中

对于 Linux 和 MacOS:

alias epub2tts='docker run -v "$PWD:$PWD" -v ~/.local/share/tts:/root/.local/share/tts -w "$PWD" ghcr.io/aedocw/epub2tts:release'

对于 Windows:先决条件:

  • 安装 Docker 桌面

  • 从 PowerShell 运行“mkdir ~/.local/share/tts”


#Example for running scan of "mybook.epub"
docker run -v ${PWD}/.local/share/tts:/root/.local/share/tts -v ${PWD}:/root -w /root ghcr.io/aedocw/epub2tts:release mybook.epub --scan

#Example for reading parts 3 through 15 of "mybook.epub"
docker run -v ${PWD}/.local/share/tts:/root/.local/share/tts -v ${PWD}:/root -w /root ghcr.io/aedocw/epub2tts:release mybook.epub --start 3 --end 15

项目链接

https://github.com/aedocw/epub2tts

你可能感兴趣的:(智能语音,人工智能,epub)