文本转语音工具 - 支持脚本解析、情绪标记和后处理,基于 Edge TTS
将文本转换为语音,支持 Kokoro TTS v1.1-zh(本地 Docker,102 个中文音色)和 Edge TTS(在线)。
| 特性 | Kokoro TTS v1.1-zh | Edge TTS |
|---|---|---|
| 质量 | 更自然、接近真人 | 标准 Neural 语音 |
| 网络 | 不需要(本地 Docker) | 需要网络连接 |
| 中文女声 | 55 个 | 13 个 |
| 中文男声 | 44 个 | 5 个 |
| 英文音色 | 3 个 | 0(需切换英文声音) |
| 语速调节 | speed 参数 | rate/pitch/volume |
| 前提 | Docker 容器需运行 | 无 |
| 配置值 | kokoro |
edge |
# 默认使用 Kokoro TTS(当前配置)
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py <文本文件>
# 指定引擎
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --engine kokoro
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --engine edge
# 指定声音
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -v zf_094
# 指定输出文件
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -o output.mp3
# 调整语速(Kokoro)
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --speed 1.2
# 列出所有可用声音
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py --list-voices
使用 --list-voices 查看完整列表(102 个)。
zf_094 - 女声(默认,自然温柔)zf_001 - 女声zm_009 - 男声zm_050 - 男声af_maple - 女声(Maple)af_sol - 女声(Sol)bf_vale - 男声(Vale)zf_XXX - 中文女声(55 个)zm_XXX - 中文男声(44 个)af_/bf_ - 英文声音(3 个)Kokoro TTS 需要 Docker 容器运行:
# 启动
cd /Users/m/document/QNSZ/project/kokoro-tts && ./start.sh
# 停止
cd /Users/m/document/QNSZ/project/kokoro-tts && ./stop.sh
# Web UI 试听
# http://localhost:8880/web/
自动识别并移除播客脚本中的注释和标记:
(00:00)[BGM渐入:...](主播声音:...) (停顿 1秒)**文本**v1.1-zh 模型支持中英文混合文本的自然朗读。
可选集成 voice-changer skill 进行变声处理。
配置文件位于:~/.claude/skills/text-to-speech/config/tts_config.json
关键配置项:
tts_engine: "kokoro" 或 "edge"(默认引擎)kokoro_tts: Kokoro 引擎配置(API URL、默认声音、语速)edge_tts: Edge 引擎配置(声音、语速、音调、音量)available_voices: 按引擎分组的可用声音列表输入文本/文件
↓
脚本解析(移除注释和标记)
↓
Kokoro TTS / Edge TTS 语音合成
↓
后处理(voice-changer,可选)
↓
输出 MP3 文件
pip install edge-tts