返回顶部
a

aliyun-speech-transcriber阿里云语音转录

Transcribe publicly accessible audio or video URLs with Aliyun speech services. Use when the user wants speech-to-text via Aliyun DashScope, needs transcript JSON or extracted plain text, or wants to process a cloud-accessible media URL (including signed Qiniu URLs) into transcription results.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
121
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

aliyun-speech-transcriber

阿里云语音转写

使用此技能将外部可访问的媒体URL转换为转写结果。

当前范围

当前实现专注于使用paraformer-v2模型的DashScope文件转写,与现有的Java服务模式保持一致。

所需环境变量

  • - ASRDASHSCOPEAPI_KEY

支持回退:

  • - DASHSCOPEAPIKEY

可选:

  • - ALIYUNSPEECHMODEL - 默认为paraformer-v2
  • ALIYUNSPEECHLANGHINTS - 默认为zh,en
  • ALIYUNSPEECHPOLLSECONDS - 默认为5
  • ALIYUNSPEECHTIMEOUT_SECONDS - 默认为1800

输入

传入一个或多个外部可访问的URL:

powershell
node scripts/transcribe.js --file-url https://example.com/audio.mp3

多个文件:

powershell
node scripts/transcribe.js --file-url https://a.com/1.mp3 --file-url https://a.com/2.mp3

输出

脚本返回包含以下内容的JSON:

  • - success
  • provider
  • engine
  • taskId
  • requestId
  • results
  • text

text是从最终JSON结果中尽力提取的纯文本内容。

从七牛云链式调用

典型工作流程:

  1. 1. 使用qiniu-upload上传本地文件。
  2. 如果域名不允许匿名读取,优先使用带签名的私有URL。
  3. 将返回的URL传入此技能。

安全规则

  • - 切勿硬编码阿里云凭证。
  • 如果缺少DASHSCOPEAPIKEY,立即失败。
  • 仅发送用户意图转写的URL。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 aliyun-speech-transcriber-1776064571 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 aliyun-speech-transcriber-1776064571 技能

通过命令行安装

skillhub install aliyun-speech-transcriber-1776064571

下载

⬇ 下载 aliyun-speech-transcriber v0.1.0(免费)

文件大小: 4.16 KB | 发布时间: 2026-4-14 14:32

v0.1.0 最新 2026-4-14 14:32
Initial release of Aliyun Speech Transcriber skill.

- Enables transcription of publicly accessible audio/video URLs via Aliyun DashScope.
- Supports JSON and plain-text transcript extraction from media URLs.
- Accepts multiple URLs and integrates with Qiniu-uploaded media.
- Requires `ASR_DASHSCOPE_API_KEY` environment variable for authentication.
- Provides configurable model, language hints, polling interval, and timeout options.
- Returns structured JSON including transcript text and metadata.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部