返回顶部
a

alicloud-ai-audio-cosyvoice-voice-design阿里云语音设计

Use when designing custom voices with Alibaba Cloud Model Studio CosyVoice customization models, especially cosyvoice-v3.5-plus or cosyvoice-v3.5-flash, from a voice prompt plus preview text before using the returned voice_id in TTS.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
235
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

alicloud-ai-audio-cosyvoice-voice-design

技能名称: alicloud-ai-audio-cosyvoice-voice-design
详细描述:
类别: provider

Model Studio CosyVoice 声音设计

使用 CosyVoice 声音注册 API,通过自然语言声音描述创建定制声音。

关键模型名称

使用 model=voice-enrollment 并选择以下 target_model 值之一:

  • - cosyvoice-v3.5-plus
  • cosyvoice-v3.5-flash
  • cosyvoice-v3-plus
  • cosyvoice-v3-flash

本仓库推荐默认值:

  • - target_model=cosyvoice-v3.5-plus

区域与兼容性

  • - cosyvoice-v3.5-plus 和 cosyvoice-v3.5-flash 仅在中国大陆部署模式(北京端点)下可用。
  • 在国际部署模式(新加坡端点)下,cosyvoice-v3-plus 和 cosyvoice-v3-flash 不支持声音克隆/设计。
  • target_model 必须与后续的语音合成模型匹配。

端点

  • - 国内:https://dashscope.aliyuncs.com/api/v1/services/audio/tts/customization
  • 国际:https://dashscope-intl.aliyuncs.com/api/v1/services/audio/tts/customization

前提条件

  • - 在环境中设置 DASHSCOPEAPIKEY,或将 dashscopeapikey 添加到 ~/.alibabacloud/credentials。

标准化接口 (cosyvoice.voice_design)

请求

  • - model (字符串,可选):固定为 voice-enrollment
  • targetmodel (字符串,可选):默认为 cosyvoice-v3.5-plus
  • prefix (字符串,必填):仅限字母/数字,最多10个字符
  • voiceprompt (字符串,必填):最多500个字符,仅支持中文或英文
  • previewtext (字符串,必填):最多200个字符,支持中文或英文
  • languagehints (数组[字符串],可选):zh 或 en,应与 previewtext 匹配
  • samplerate (整数,可选):例如 24000
  • response_format (字符串,可选):例如 wav

响应

  • - voiceid (字符串)
  • requestid (字符串)
  • status (字符串,可选)

操作指南

  • - 保持 voiceprompt 具体:音色、年龄范围、语速、情感、清晰度和场景。
  • 如果使用 languagehints,它应与 preview_text 的语言匹配。
  • 设计的声音名称在生成的后端命名规范中包含 -vd- 标记。

本地辅助脚本

准备一个标准化的请求 JSON:

bash
python skills/ai/audio/alicloud-ai-audio-cosyvoice-voice-design/scripts/preparecosyvoicedesign_request.py \
--target-model cosyvoice-v3.5-plus \
--prefix announcer \
--voice-prompt 沉稳的中年男性播音员,低沉有磁性,语速平稳,吐字清晰。 \
--preview-text 各位听众朋友,大家好,欢迎收听晚间新闻。 \
--language-hint zh

验证

bash
mkdir -p output/alicloud-ai-audio-cosyvoice-voice-design
for f in skills/ai/audio/alicloud-ai-audio-cosyvoice-voice-design/scripts/*.py; do
python3 -m py_compile $f
done
echo pycompileok > output/alicloud-ai-audio-cosyvoice-voice-design/validate.txt

通过标准:命令退出码为0,且 output/alicloud-ai-audio-cosyvoice-voice-design/validate.txt 已生成。

输出与证据

  • - 将工件、命令输出和 API 响应摘要保存到 output/alicloud-ai-audio-cosyvoice-voice-design/ 目录下。
  • 在证据文件中包含 targetmodel、prefix、voiceprompt 和 preview_text。

参考资料

  • - references/api_reference.md
  • references/sources.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 alicloud-ai-audio-cosyvoice-voice-design-1776151802 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 alicloud-ai-audio-cosyvoice-voice-design-1776151802 技能

通过命令行安装

skillhub install alicloud-ai-audio-cosyvoice-voice-design-1776151802

下载

⬇ 下载 alicloud-ai-audio-cosyvoice-voice-design v1.0.0(免费)

文件大小: 6.22 KB | 发布时间: 2026-4-15 13:33

v1.0.0 最新 2026-4-15 13:33
batch publish from alicloud-skills on 2026-03-11

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部