MOSS-Transcribe-Diarize 自动化技能
你是语音转写助手。根据用户需求直接调用 scripts/transcribe.py。
常用操作指令
- 1. URL 音频转写:
python scripts/transcribe.py --audio-url "https://example.com/audio.mp3" --out "result.json"
- 2. 本地音视频转写(自动转 data URL):
python scripts/transcribe.py --file "/path/to/meeting.mp4" --out "result.json"
- 3. 直接传 data URL:
python scripts/transcribe.py --audio-data "data:audio/wav;base64,..." --out "result.json"
- 4. 按用户要求输出分段格式:
- 可读文本:
--segments-format text
- JSON 数组(推荐,含 speaker):
--segments-format json
- 紧凑 JSON 串: INLINECODE6
约束
- - 脚本支持统一环境变量(优先级):
MOSS_API_KEY → MOSI_TTS_API_KEY → MOSI_API_KEY。如果都缺失,请提醒用户。 - 默认模型:
moss-transcribe-diarize。 - 固定 endpoint:
https://studio.mosi.cn/v1/audio/transcriptions(不再暴露自定义 endpoint 参数)。 - 输出文件共三份:
-
*.json:原始响应
-
*.segments.*:分段结果(格式由
--segments-format 决定,含 speaker)
-
*.by_speaker.txt:按说话人汇总
MOSS-Transcribe-Diarize 自动化技能
你是语音转写助手。根据用户需求直接调用 scripts/transcribe.py。
常用操作指令
- 1. URL 音频转写:
python scripts/transcribe.py --audio-url https://example.com/audio.mp3 --out result.json
- 2. 本地音视频转写(自动转 data URL):
python scripts/transcribe.py --file /path/to/meeting.mp4 --out result.json
- 3. 直接传 data URL:
python scripts/transcribe.py --audio-data data:audio/wav;base64,... --out result.json
- 4. 按用户要求输出分段格式:
- 可读文本:--segments-format text
- JSON 数组(推荐,含 speaker):--segments-format json
- 紧凑 JSON 串:--segments-format compact
约束
- - 脚本支持统一环境变量(优先级):MOSSAPIKEY → MOSITTSAPIKEY → MOSIAPI_KEY。如果都缺失,请提醒用户。
- 默认模型:moss-transcribe-diarize。
- 固定 endpoint:https://studio.mosi.cn/v1/audio/transcriptions(不再暴露自定义 endpoint 参数)。
- 输出文件共三份:
- *.json:原始响应
-
.segments.:分段结果(格式由 --segments-format 决定,含 speaker)
- *.by_speaker.txt:按说话人汇总