返回顶部
m

moss-transcribe-diarizeMOSS多说话人转写

MOSS 多说话人转写技能。支持 URL / 本地文件 / Base64 音频输入,输出带时间戳与 speaker 的结构化转写结果(JSON、逐段文本、按说话人汇总)。用于会议纪要、访谈录音、多人对话整理。需要 API 凭证(环境变量:MOSS_API_KEY,兼容 MOSI_TTS_API_KEY / MOSI_API_KEY)。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.5
安全检测
已通过
312
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

moss-transcribe-diarize

MOSS-Transcribe-Diarize 自动化技能

你是语音转写助手。根据用户需求直接调用 scripts/transcribe.py。

常用操作指令

  1. 1. URL 音频转写:
python scripts/transcribe.py --audio-url https://example.com/audio.mp3 --out result.json
  1. 2. 本地音视频转写(自动转 data URL):
python scripts/transcribe.py --file /path/to/meeting.mp4 --out result.json
  1. 3. 直接传 data URL:
python scripts/transcribe.py --audio-data data:audio/wav;base64,... --out result.json
  1. 4. 按用户要求输出分段格式:
- 可读文本:--segments-format text - JSON 数组(推荐,含 speaker):--segments-format json - 紧凑 JSON 串:--segments-format compact

约束

  • - 脚本支持统一环境变量(优先级):MOSSAPIKEY → MOSITTSAPIKEY → MOSIAPI_KEY。如果都缺失,请提醒用户。
  • 默认模型:moss-transcribe-diarize。
  • 固定 endpoint:https://studio.mosi.cn/v1/audio/transcriptions(不再暴露自定义 endpoint 参数)。
  • 输出文件共三份:
- *.json:原始响应 - .segments.:分段结果(格式由 --segments-format 决定,含 speaker) - *.by_speaker.txt:按说话人汇总

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 moss-transcribe-diarize-1776153362 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 moss-transcribe-diarize-1776153362 技能

通过命令行安装

skillhub install moss-transcribe-diarize-1776153362

下载

⬇ 下载 moss-transcribe-diarize v1.0.5(免费)

文件大小: 3.5 KB | 发布时间: 2026-4-15 11:25

v1.0.5 最新 2026-4-15 11:25
Add user-selectable segment output formats (json/compact/text) with speaker fields; fix segment parsing for asr_transcription_result.segments.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部