返回顶部
s

senseaudio-clone-wizard声音克隆向导

Guided voice cloning workflow — from recording tips to first playback. Use when users want to clone their voice, create a custom voice, or ask "怎么克隆声音", "我想用自己的声音合成", "音色克隆怎么做". Walks users through recording requirements, checks audio quality before they upload, guides them to the platform for cloning, then generates a preview with their new voice.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
196
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

senseaudio-clone-wizard

SenseAudio 克隆向导

一个引导式的语音克隆体验。API 本身很简单——难点在于获取干净的录音。这个技能负责处理这些。

注意:SenseAudio 不支持通过 API 进行克隆。实际的克隆操作在平台 https://senseaudio.cn 上完成。本技能引导用户完成整个流程,并处理可自动化的步骤。


第一阶段:录音前

当用户表示想要克隆自己的声音时,在录音前展示以下指南:



录音前请注意:

  • - 环境:找一个安静的房间,关掉空调、风扇、电视
  • 距离:嘴巴距离麦克风约 20cm,不要太近(会爆音)也不要太远(声音发虚)
  • 时长:3–30 秒,朗读一段自然的文字效果最好
  • 格式:MP3、WAV 或 AAC,文件不超过 50MB
  • 内容:朗读一段话,语速自然,避免长时间停顿

推荐朗读内容(约 15 秒):

大家好,我是 [你的名字]。今天天气不错,阳光明媚。我喜欢在这样的日子里出去走走,感受大自然的美好。希望每一天都能这样轻松愉快。

录好后把文件发给我,我来帮你检测质量。



第二阶段:音频质量检测

当用户上传音频文件时,运行质量检测:

bash
RESULT=$(curl -s -X POST https://api.senseaudio.cn/v1/audio/analysis \
-H Authorization: Bearer $SENSEAUDIOAPIKEY \
-F model=sense-asr-check \
-F file=@)

解析响应并翻译成通俗语言:

噪声评分解读:

noise_score告诉用户
0.0 – 0.2录音质量很好,可以直接提交克隆
0.2 – 0.4
录音质量不错,有轻微噪声,克隆效果可能略有影响,建议在条件允许时重录 |
| 0.4 – 0.6 | 录音噪声较明显,建议重录以获得更好的克隆效果 |
| 0.6 – 1.0 | 录音噪声严重,强烈建议重录,否则克隆出的音色可能失真 |

噪声类型翻译:

noisetypes 值告诉用户
backgroundnoise背景噪声(周围环境声)
hum
嗡嗡声(可能是空调、电器) |
| static | 静电杂音(可能是线材或设备问题) |
| wind | 风噪(话筒离嘴太近或有风) |
| echo / reverb | 回声/混响(房间太空旷,建议换小房间或靠近软装) |

示例诊断输出:

你的录音检测结果:

  • - 时长:14.3 秒 ✓
  • 噪声评分:0.52(中等)
  • 检测到:嗡嗡声(可能是空调)

建议:关掉空调后重新录一段。如果条件不允许,可以继续提交,
但克隆出的音色可能带有轻微底噪。要继续还是重录?

如果 has_noise 为 false 或评分 < 0.2,跳过警告直接进入第三阶段。

第三阶段:平台克隆

克隆操作必须在 SenseAudio 平台上完成——API 不支持直接克隆请求。

引导用户:



录音质量通过!接下来去平台完成克隆:

  1. 1. 打开 https://senseaudio.cn,登录你的账号
  2. 进入「音色克隆」页面
  3. 点击「上传音频」,选择你刚才的录音文件
  4. 系统会自动训练,通常几秒内完成
  5. 训练完成后,在「我的音色」中找到新音色,复制它的 voiceid
  6. 把 voiceid 发给我,我来帮你生成第一段试听

注意槽位: 每个账号有有限的克隆槽位。如果槽位已满,需要先删除旧音色才能克隆新的。



第四阶段:首次试听

用户提供 voice_id 后,合成一段欢迎信息,让他们第一次听到自己的 AI 声音:

默认预览文本(温暖且个性化):

你好!这是我的 AI 声音。从今天起,我可以用这个声音说任何我想说的话了。

bash
curl -s -X POST https://api.senseaudio.cn/v1/t2a_v2 \
-H Authorization: Bearer $SENSEAUDIOAPIKEY \
-H Content-Type: application/json \
-d {
\model\: \SenseAudio-TTS-1.0\,
\text\: \你好!这是我的 AI 声音。从今天起,我可以用这个声音说任何我想说的话了。\,
\stream\: false,
\voicesetting\: { \voiceid\: \\ },
\audio_setting\: { \format\: \mp3\ }
} -o preview.json

jq -r .data.audio preview.json | xxd -r -p > myvoicepreview.mp3

生成后:告知用户文件已就绪,并提到他们现在可以将这个 voice_id 用于任何 SenseAudio TTS 功能——包括用于快速合成的 senseaudio-tts-quick 技能或用于精确发音控制的 senseaudio-polyglot-tts 技能。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 clone-wizard-1776077538 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 clone-wizard-1776077538 技能

通过命令行安装

skillhub install clone-wizard-1776077538

下载

⬇ 下载 senseaudio-clone-wizard v1.0.0(免费)

文件大小: 3.62 KB | 发布时间: 2026-4-15 12:12

v1.0.0 最新 2026-4-15 12:12
senseaudio-clone-wizard 1.0.0

- Introduces a step-by-step guided workflow for voice cloning via SenseAudio, supporting both English and Chinese requests.
- Helps users prepare optimal recordings with practical tips and sample texts.
- Automates audio quality checks and provides user-friendly feedback and actionable suggestions.
- Guides users through the required steps on the SenseAudio platform for actual cloning.
- Assists with first-time playback by using the new cloned voice for an instant preview and recommends next steps to use their custom voice.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部