返回顶部
s

speech-to-text语音转文字

Transcribe audio to text with Whisper models via inference.sh CLI. Models: Fast Whisper Large V3, Whisper V3 Large. Capabilities: transcription, translation, multi-language, timestamps. Use for: meeting transcription, subtitles, podcast transcripts, voice notes. Triggers: speech to text, transcription, whisper, audio to text, transcribe audio, voice to text, stt, automatic transcription, subtitles generation, transcribe meeting, audio transcription, whisper ai

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.5
安全检测
已通过
2,560
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

speech-to-text

语音转文字

通过 inference.sh 命令行工具将音频转录为文字。

语音转文字

快速开始

bash
curl -fsSL https://cli.inference.sh | sh && infsh login

infsh app run infsh/fast-whisper-large-v3 --input {audio_url: https://audio.mp3}

安装说明: 安装脚本仅检测您的操作系统/架构,从 dist.inference.sh 下载匹配的二进制文件,并验证其 SHA-256 校验和。无需提升权限或后台进程。也可手动安装与验证

可用模型

模型应用 ID最佳用途
Fast Whisper V3infsh/fast-whisper-large-v3快速转录
Whisper V3 Large
infsh/whisper-v3-large | 最高准确率 |

示例

基础转录

bash
infsh app run infsh/fast-whisper-large-v3 --input {audio_url: https://meeting.mp3}

带时间戳

bash
infsh app sample infsh/fast-whisper-large-v3 --save input.json

{

audio_url: https://podcast.mp3,

timestamps: true

}

infsh app run infsh/fast-whisper-large-v3 --input input.json

翻译(转英语)

bash
infsh app run infsh/whisper-v3-large --input {
audio_url: https://french-audio.mp3,
task: translate
}

从视频提取

bash

先从视频中提取音频


infsh app run infsh/video-audio-extractor --input {video_url: https://video.mp4} > audio.json

转录提取的音频

infsh app run infsh/fast-whisper-large-v3 --input {audio_url: }

工作流程:视频字幕

bash

1. 转录视频音频


infsh app run infsh/fast-whisper-large-v3 --input {
audio_url: https://video.mp4,
timestamps: true
} > transcript.json

2. 使用转录文本生成字幕

infsh app run infsh/caption-videos --input { video_url: https://video.mp4, captions: }

支持的语言

Whisper 支持 99 种以上语言,包括:
英语、西班牙语、法语、德语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语、印地语、俄语等。

使用场景

  • - 会议:转录录音
  • 播客:生成文字稿
  • 字幕:为视频创建字幕
  • 语音笔记:转换为可搜索文本
  • 访谈:为研究转录
  • 无障碍:让音频内容可访问

输出格式

返回 JSON,包含:

  • - text:完整转录文本
  • segments:带时间戳的段落(如请求)
  • language:检测到的语言

相关技能

bash

完整平台技能(150+ 应用)


npx skills add inference-sh/skills@inference-sh

文字转语音(反向操作)

npx skills add inference-sh/skills@text-to-speech

视频生成(添加字幕)

npx skills add inference-sh/skills@ai-video-generation

AI 虚拟形象(配合转录文本进行唇形同步)

npx skills add inference-sh/skills@ai-avatar-video

浏览所有音频应用:infsh app list --category audio

文档

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 speech-to-text-1776159601 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 speech-to-text-1776159601 技能

通过命令行安装

skillhub install speech-to-text-1776159601

下载

⬇ 下载 speech-to-text v0.1.5(免费)

文件大小: 2.2 KB | 发布时间: 2026-4-15 10:31

v0.1.5 最新 2026-4-15 10:31
- Updated documentation for clear setup instructions using inference.sh CLI.
- Detailed available Whisper model options, usage examples, and input formats.
- Added new sections on extracting audio from video, translation, and video subtitle workflows.
- Enhanced guidance for supported languages and output structure.
- Improved 'Related Skills' for easy access to complementary AI tools.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部