Smithery Logo
MCPsSkillsDocsPricing
Login
Smithery Logo

Accelerating the Agent Economy

Resources

DocumentationPrivacy PolicySystem Status

Company

PricingAboutBlog

Connect

© 2026 Smithery. All rights reserved.

    wlzh

    text-to-speech

    wlzh/text-to-speech
    AI & ML
    108
    1 installs

    About

    SKILL.md

    Install

    Install via Skills CLI

    or add to your agent
    • Claude Code
      Claude Code
    • Codex
      Codex
    • OpenClaw
      OpenClaw
    • Cursor
      Cursor
    • Amp
      Amp
    • GitHub Copilot
      GitHub Copilot
    • Gemini CLI
      Gemini CLI
    • Kilo Code
      Kilo Code
    • Junie
      Junie
    • Replit
      Replit
    • Windsurf
      Windsurf
    • Cline
      Cline
    • Continue
      Continue
    • OpenCode
      OpenCode
    • OpenHands
      OpenHands
    • Roo Code
      Roo Code
    • Augment
      Augment
    • Goose
      Goose
    • Trae
      Trae
    • Zencoder
      Zencoder
    • Antigravity
      Antigravity
    ├─
    ├─
    └─

    About

    文本转语音工具 - 支持脚本解析、情绪标记和后处理,基于 Edge TTS

    SKILL.md

    Text-to-Speech Skill

    将文本转换为语音,支持 Kokoro TTS v1.1-zh(本地 Docker,102 个中文音色)和 Edge TTS(在线)。

    引擎对比

    特性 Kokoro TTS v1.1-zh Edge TTS
    质量 更自然、接近真人 标准 Neural 语音
    网络 不需要(本地 Docker) 需要网络连接
    中文女声 55 个 13 个
    中文男声 44 个 5 个
    英文音色 3 个 0(需切换英文声音)
    语速调节 speed 参数 rate/pitch/volume
    前提 Docker 容器需运行 无
    配置值 kokoro edge

    使用说明

    # 默认使用 Kokoro TTS(当前配置)
    python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py <文本文件>
    
    # 指定引擎
    python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --engine kokoro
    python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --engine edge
    
    # 指定声音
    python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -v zf_094
    
    # 指定输出文件
    python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -o output.mp3
    
    # 调整语速(Kokoro)
    python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --speed 1.2
    
    # 列出所有可用声音
    python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py --list-voices
    

    Kokoro TTS v1.1-zh 声音

    使用 --list-voices 查看完整列表(102 个)。

    推荐声音

    • zf_094 - 女声(默认,自然温柔)
    • zf_001 - 女声
    • zm_009 - 男声
    • zm_050 - 男声

    英文声音

    • af_maple - 女声(Maple)
    • af_sol - 女声(Sol)
    • bf_vale - 男声(Vale)

    声音命名规则

    • zf_XXX - 中文女声(55 个)
    • zm_XXX - 中文男声(44 个)
    • af_/bf_ - 英文声音(3 个)

    启动 Kokoro 服务

    Kokoro TTS 需要 Docker 容器运行:

    # 启动
    cd /Users/m/document/QNSZ/project/kokoro-tts && ./start.sh
    
    # 停止
    cd /Users/m/document/QNSZ/project/kokoro-tts && ./stop.sh
    
    # Web UI 试听
    # http://localhost:8880/web/
    

    核心功能

    1. 脚本解析

    自动识别并移除播客脚本中的注释和标记:

    • 时间戳:(00:00)
    • BGM 注释:[BGM渐入:...]
    • 舞台指示:(主播声音:...) (停顿 1秒)
    • Markdown 标记:**文本**

    2. 中英文混合朗读

    v1.1-zh 模型支持中英文混合文本的自然朗读。

    3. 后处理集成

    可选集成 voice-changer skill 进行变声处理。

    配置文件

    配置文件位于:~/.claude/skills/text-to-speech/config/tts_config.json

    关键配置项:

    • tts_engine: "kokoro" 或 "edge"(默认引擎)
    • kokoro_tts: Kokoro 引擎配置(API URL、默认声音、语速)
    • edge_tts: Edge 引擎配置(声音、语速、音调、音量)
    • available_voices: 按引擎分组的可用声音列表

    工作流程

    输入文本/文件
        ↓
    脚本解析(移除注释和标记)
        ↓
    Kokoro TTS / Edge TTS 语音合成
        ↓
    后处理(voice-changer,可选)
        ↓
    输出 MP3 文件
    

    依赖

    • Kokoro TTS: Docker(容器运行在 localhost:8880)
    • Edge TTS: pip install edge-tts

    性能参考

    • Kokoro TTS: 1000字约 3-5 秒(本地 Docker CPU)
    • Edge TTS: 1000字约 10-20 秒(受网络影响)
    Recommended Servers
    Google Docs
    Google Docs
    Jina AI
    Jina AI
    Repository
    wlzh/skills
    Files