返回顶部
c

coze-voice-genCoze语音生成

Text-to-Speech (TTS) and Speech-to-Text (ASR) using coze-coding-dev-sdk. Returns results directly to stdout.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
279
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

coze-voice-gen

Coze 语音生成

使用 coze-coding-dev-sdk 实现文本转语音(TTS)和自动语音识别(ASR)。

文本转语音(TTS)

单条音频

bash
npx ts-node {baseDir}/scripts/tts.ts --text 您好,欢迎使用我们的服务!

使用不同音色

bash
npx ts-node {baseDir}/scripts/tts.ts \
--text 这是一段男声 \
--speaker zhmalem191uranusbigtts

批量生成

bash
npx ts-node {baseDir}/scripts/tts.ts \
--texts 第一章:简介 第二章:快速入门 第三章:高级主题 \
--speaker zhfemalexueayisaturnbigtts

自定义参数

bash
npx ts-node {baseDir}/scripts/tts.ts \
--text 快速且响亮的公告! \
--speech-rate 30 \
--loudness-rate 20 \
--format mp3 \
--sample-rate 48000

TTS 参数选项

参数描述
--text <文本>需要合成的单条文本
--texts <文本列表...>
批量生成的多个文本 | | --speaker | 音色 ID(默认:zhfemalexiaoheuranusbigtts) | | --format <格式> | mp3、pcm、ogg_opus(默认:mp3) | | --sample-rate <赫兹> | 8000-48000(默认:24000) | | --speech-rate <数值> | -50 到 100(默认:0) | | --loudness-rate <数值>| -50 到 100(默认:0) |

TTS 输出

脚本直接将音频 URL 输出到标准输出:

[1/1] 您好,欢迎使用我们的服务!
https://example.com/generated-audio.mp3

可用音色

通用音色:

  • - zhfemalexiaoheuranusbigtts - 晓荷(默认)
  • zhfemalevvuranusbigtts - Vivi(中英文)
  • zhmalem191uranusbigtts - 云舟(男声)
  • zhmaletaochenguranusbigtts - 小田(男声)

有声读物:

  • - zhfemalexueayisaturnbigtts - 儿童有声读物

视频配音:

  • - zhmaledayisaturnbigtts - 大义(男声)
  • zhfemalemizaisaturnbigtts - 米仔(女声)
  • zhfemalejitangnvsaturnbigtts - 励志女声

角色扮演:

  • - saturnzhfemalekeainvshengtob - 可爱女生
  • saturnzhmaleshuanglangshaoniantob - 爽朗少年

语音转文字(ASR)

从 URL 转换

bash
npx ts-node {baseDir}/scripts/asr.ts --url https://example.com/audio.mp3

从本地文件转换

bash
npx ts-node {baseDir}/scripts/asr.ts --file ./recording.mp3

ASR 参数选项

参数描述
--url <URL>音频文件 URL
--file <路径>
本地音频文件路径 |

ASR 输出

转录结果直接打印到标准输出:

============================================================
转录文本
============================================================
您好,这是从音频文件中转录的文本...
============================================================

时长:1分30秒
片段数:5

ASR 要求

  • - 时长:≤ 2小时
  • 文件大小:≤ 100MB
  • 格式:WAV、MP3、OGG OPUS、M4A

注意事项

  • - 音频 URL 有有效期限制,请尽快使用
  • 语速:负值表示减慢,正值表示加快
  • 音量:负值表示降低,正值表示提高

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 coze-voice-gen-1776075616 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 coze-voice-gen-1776075616 技能

通过命令行安装

skillhub install coze-voice-gen-1776075616

下载

⬇ 下载 coze-voice-gen v0.1.0(免费)

文件大小: 4.93 KB | 发布时间: 2026-4-15 12:20

v0.1.0 最新 2026-4-15 12:20
Initial release.

- Provides Text-to-Speech (TTS) and Speech-to-Text (ASR) features using coze-coding-dev-sdk.
- Supports single and batch text synthesis with customizable voices and audio parameters.
- Returns audio URLs or transcription results directly to stdout.
- Allows both URL and local file input for ASR.
- Includes multiple built-in voice options for various use cases.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部