返回顶部
d

doubao-tts豆包语音合成

使用豆包(火山引擎)语音合成大模型 API 将文本转换为语音音频文件。支持声音复刻音色(S_ 开头的音色ID)和官方预置音色。当用户要求"语音合成"、"文字转语音"、"TTS"、"朗读文本"、"生成语音"、"用我的声音读"、"豆包语音"、"声音复刻合成"等相关请求时,务必使用此 skill。即使用户只是说"帮我把这段话读出来"或"生成一段音频",也应触发此 skill。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
396
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

doubao-tts

豆包语音合成 Skill(Doubao TTS)

本 skill 通过火山引擎豆包语音合成大模型的单向流式 HTTP V3 接口,将文本合成为语音音频文件。

官方文档:豆包语音合成 API 文档

前置要求

用户需要提供以下环境变量(通过 export 设置或在脚本参数中传入):

  • - DOUBAOAPPID:火山引擎控制台获取的 APP ID
  • DOUBAOACCESSKEY:火山引擎控制台获取的 Access Token
  • DOUBAOSPEAKER:音色 ID(可选,默认为 zhfemalexiaoheuranus_bigtts)
- 声音复刻音色以 S 开头,可前往官方后台创建:音色复刻控制台 - 官方预置音色详见下方音色对照表

如果用户没有设置 DOUBAOAPPID 和 DOUBAOACCESSKEY,先提醒用户设置,并告知获取方式:登录火山引擎控制台 → 豆包语音 → 创建应用 → 获取 APP ID 和 Access Token。

如果用户未设置 DOUBAOSPEAKER,默认使用 zhfemalexiaoheuranus_bigtts(小何 2.0,通用中文女声)。

使用流程

1. 确认参数

向用户确认以下信息(有合理默认值的可以跳过确认):

参数说明默认值
待合成文本要转语音的文字内容(必填)
音色 ID(speaker)
音色标识符。声音复刻音色以 S 开头;根据上下文从下方音色表中选择合适音色 | $DOUBAOSPEAKER 或 zhfemalexiaoheuranusbigtts |
| 资源 ID(resource_id) | 声音复刻用 seed-icl-1.0;官方 1.0 音色用 seed-tts-1.0;官方 2.0 音色用 seed-tts-2.0 | seed-tts-2.0 |
| 音频格式(format) | mp3 / ogg_opus / pcm | mp3 |
| 采样率(sample_rate) | 可选 8000/16000/22050/24000/32000/44100/48000 | 24000 |
| 情感(emotion) | 情感类型,仅多情感音色支持。中文音色:happy / sad / angry / surprised / fear / hate / excited / coldness / neutral 等;英文音色:neutral / happy / angry / sad / excited / chat / warm 等 | 不设置 |
| 情绪强度(emotion_scale) | 范围 1~5,值越大情感越明显(非线性),需配合 emotion 使用 | 4 |
| 输出文件名 | 生成的音频文件名 | output.mp3 |

2. 执行合成

运行脚本:

bash

基础用法(resource-id 自动推断)


python3 /path/to/doubao-tts/scripts/tts_synthesize.py \
--text 要合成的文本 \
--speaker ${DOUBAOSPEAKER:-zhfemalexiaoheuranus_bigtts} \
--format mp3 \
--sample-rate 24000 \
--output /mnt/user-data/outputs/output.mp3

带情感的合成(仅多情感音色支持)

python3 /path/to/doubao-tts/scripts/tts_synthesize.py \ --text 要合成的文本 \ --speaker zhfemaleshuangkuaisisiemov2marsbigtts \ --emotion happy \ --emotion-scale 4 \ --output /mnt/user-data/outputs/output.mp3

环境变量 DOUBAOAPPID 和 DOUBAOACCESSKEY 必须已设置。也可以通过 --app-id 和 --access-key 参数直接传入。

3. 输出结果

脚本会将合成的音频保存到指定路径。合成完成后,使用 present_files 工具将文件呈现给用户。

音色对照表

Agent 应根据上下文(用户要求的角色、场景、风格)从下表中选择最合适的音色 ID。

完整音色列表参见官方文档:音色列表

豆包语音合成 2.0 音色(推荐,resource_id 使用 seed-tts-2.0)

场景音色名称voicetype(音色ID)语种适用角色/描述
通用场景小何 2.0 ⭐默认zhfemalexiaoheuranusbigtts中文通用女声,自然亲切
通用场景
Vivi 2.0 | zh
femalevvuranus_bigtts | 中文/日文/印尼语/西班牙语 | 多语种女声,情感丰富 | | 通用场景 | 云舟 2.0 | zhmalem191uranusbigtts | 中文 | 通用男声 | | 通用场景 | 小天 2.0 | zhmaletaochenguranusbigtts | 中文 | 通用男声,年轻 | | 通用场景 | 刘飞 2.0 | zhmaleliufeiuranusbigtts | 中文 | 通用男声 | | 通用场景 | 魅力苏菲 2.0 | zhmalesophieuranusbigtts | 中文 | 通用男声 | | 通用场景 | 清新女声 2.0 | zhfemaleqingxinnvshenguranusbigtts | 中文 | 清新淡雅女声 | | 通用场景 | 甜美小源 2.0 | zhfemaletianmeixiaoyuanuranusbigtts | 中文 | 甜美女声 | | 通用场景 | 甜美桃子 2.0 | zhfemaletianmeitaoziuranusbigtts | 中文 | 甜美女声 | | 通用场景 | 爽快思思 2.0 | zhfemaleshuangkuaisisiuranusbigtts | 中文 | 爽朗活泼女声 | | 通用场景 | 邻家女孩 2.0 | zhfemalelinjianvhaiuranusbigtts | 中文 | 亲切邻家风格女声 | | 通用场景 | 少年梓辛 2.0 | zhmaleshaonianzixinuranusbigtts | 中文 | 少年男声,青春感 | | 通用场景 | 魅力女友 2.0 | zhfemalemeilinvyouuranusbigtts | 中文 | 魅力成熟女声 | | 通用场景 | 流畅女声 2.0 | zhfemaleliuchangnvuranusbigtts | 中文 | 流畅自然女声,适合长文朗读 | | 通用场景 | 儒雅逸辰 2.0 | zhmaleruyayichenuranusbigtts | 中文 | 儒雅成熟男声 | | 角色扮演 | 知性灿灿 2.0 | zhfemalecancanuranusbigtts | 中文 | 知性干练女声 | | 角色扮演 | 撒娇学妹 2.0 | zhfemalesajiaoxuemeiuranusbigtts | 中文 | 撒娇可爱女声 | | 视频配音 | 猴哥 2.0 | zhmalesunwukonguranusbigtts | 中文 | 孙悟空角色,豪迈 | | 视频配音 | 佩奇猪 2.0 | zhfemalepeiqiuranusbigtts | 中文 | 卡通儿童角色 | |

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 doubao-tts-1776100223 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 doubao-tts-1776100223 技能

通过命令行安装

skillhub install doubao-tts-1776100223

下载

⬇ 下载 doubao-tts v1.0.2(免费)

文件大小: 12.91 KB | 发布时间: 2026-4-14 14:36

v1.0.2 最新 2026-4-14 14:36
fix: 在 SKILL.md frontmatter 中声明所需凭证以符合安全规范
在注册表元数据中新增 credentials 字段,明确声明调用豆包 TTS API
所需的必需凭证(DOUBAO_APP_ID、DOUBAO_ACCESS_KEY)和可选环境变量
(DOUBAO_SPEAKER),消除元数据与实际需求不一致的安全问题。

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部