Transcribe audio to text with Whisper models via inference.sh CLI. Models: Fast Whisper Large V3, Whisper V3 Large. Capabilities: transcription, translation, multi-language, timestamps. Use for: meeting transcription, subtitles, podcast transcripts, voice notes. Triggers: speech to text, transcription, whisper, audio to text, transcribe audio, voice to text, stt, automatic transcription, subtitles generation, transcribe meeting, audio transcription, whisper ai
通过 inference.sh 命令行工具将音频转录为文字。

bash
curl -fsSL https://cli.inference.sh | sh && infsh login
infsh app run infsh/fast-whisper-large-v3 --input {audio_url: https://audio.mp3}
安装说明: 安装脚本仅检测您的操作系统/架构,从 dist.inference.sh 下载匹配的二进制文件,并验证其 SHA-256 校验和。无需提升权限或后台进程。也可手动安装与验证。
| 模型 | 应用 ID | 最佳用途 |
|---|---|---|
| Fast Whisper V3 | infsh/fast-whisper-large-v3 | 快速转录 |
| Whisper V3 Large |
bash
infsh app run infsh/fast-whisper-large-v3 --input {audio_url: https://meeting.mp3}
bash
infsh app sample infsh/fast-whisper-large-v3 --save input.json
infsh app run infsh/fast-whisper-large-v3 --input input.json
bash
infsh app run infsh/whisper-v3-large --input {
audio_url: https://french-audio.mp3,
task: translate
}
bash
bash
Whisper 支持 99 种以上语言,包括:
英语、西班牙语、法语、德语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语、印地语、俄语等。
返回 JSON,包含:
bash
浏览所有音频应用:infsh app list --category audio
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 speech-to-text-1776159601 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 speech-to-text-1776159601 技能
skillhub install speech-to-text-1776159601
文件大小: 2.2 KB | 发布时间: 2026-4-15 10:31