返回顶部
y

youtube-transcribeYouTube转录

Transcribe YouTube videos with smart fallback: extracts captions first (fast, free), falls back to local Whisper transcription when no captions available. Auto-detects best Whisper backend (MLX/faster-whisper/openai-whisper) and model size based on hardware. Use when the user shares a YouTube link and wants to know what it says, get a transcript, summarize, or analyze video content. Keywords: YouTube, transcribe, transcript, subtitles, captions, speech-to-text, whisper, mlx, video to text.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
289
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

youtube-transcribe

YouTube 转录

智能 YouTube 视频转录,自动回退机制:

  1. 1. 优先字幕 — 通过 yt-dlp 提取现有字幕(手动或自动生成)。快速、免费、无需计算。
  2. Whisper 回退 — 当无字幕时,下载音频并使用最佳可用 Whisper 后端进行本地转录。

使用场景

当用户需要以下操作时使用此技能:

  • - 获取 YouTube 视频的转录文本或文字版本
  • 无需观看即可了解 YouTube 视频内容
  • 对 YouTube 视频进行总结、分析或做笔记
  • 提取视频的字幕或说明文字

触发条件

  • - 转录这个 YouTube 视频
  • 这个视频说了什么
  • 获取 [YouTube URL] 的转录文本
  • 总结这个 YouTube 视频 (先转录,再处理)
  • 任何附带理解内容请求的 YouTube URL

环境要求

必需:

  • - yt-dlp — 用于字幕提取和音频下载
  • python3

Whisper 回退(无字幕时):

  • - ffmpeg — 用于音频处理
  • 以下任一 Whisper 后端(按优先级自动检测):

1. mlx-whisper — Apple Silicon 原生,Mac 上最快(pip install mlx-whisper)
2. faster-whisper — CTranslate2 后端,CUDA/CPU 上快速(pip install faster-whisper)
3. openai-whisper — 原始 Whisper,通用回退(pip install openai-whisper)

使用方法

基础 — 转录视频

bash
python3 {baseDir}/scripts/transcribe.py https://www.youtube.com/watch?v=VIDEO_ID

指定字幕语言

bash
python3 {baseDir}/scripts/transcribe.py URL --language zh

强制使用 Whisper(跳过字幕检查)

bash
python3 {baseDir}/scripts/transcribe.py URL --force-whisper

JSON 输出

bash
python3 {baseDir}/scripts/transcribe.py URL --format json

保存到文件

bash
python3 {baseDir}/scripts/transcribe.py URL --output transcript.txt

选项

标志默认值描述
--languageauto首选字幕/转录语言(例如 zh、en、ja)
--format
text | 输出格式:text、json、srt、vtt | | --output | stdout | 将转录文本保存到文件 | | --force-whisper | false | 跳过字幕提取,直接使用 Whisper | | --backend | auto | Whisper 后端:auto、mlx、faster-whisper、whisper | | --model | auto | Whisper 模型大小:auto、large-v3、medium、small、base、tiny |

环境变量

变量描述
YTWHISPERBACKEND覆盖 Whisper 后端选择
YTWHISPERMODEL
覆盖 Whisper 模型大小 |

自动检测

Whisper 后端(优先级顺序)

  1. 1. MLX Whisper — 通过 import mlxwhisper 检测。最适合 Apple Silicon。
  2. faster-whisper — 通过 import fasterwhisper 检测。最适合 CUDA GPU,CPU 上表现良好。
  3. OpenAI Whisper — 通过 import whisper 检测。通用回退方案。

模型大小(基于可用内存)
内存模型显存/内存占用
≥16GBlarge-v3~6-10GB
≥8GB
medium | ~5GB |

| ≥4GB | small | ~2.5GB | | <4GB | base | ~1.5GB |

字幕语言优先级

当未指定 --language 时,按以下顺序搜索字幕:

  1. 1. 视频原始语言
  2. 中文变体:zh-Hant、zh-Hans、zh-TW、zh-CN、zh
  3. 英语:en
  4. 任何可用语言

输出格式

text(默认)

纯文本转录,连续文本块。

json

json { video_id: ZSnYlbIYpjs, title: 视频标题, channel: 频道名称, duration: 708, language: zh, method: captions, transcript: [ {start: 0.0, end: 5.2, text: ...}, ... ], full_text: 完整转录文本作为单个字符串 }

srt / vtt

带时间戳的标准字幕格式。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 youtube-transcribe-1776189136 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 youtube-transcribe-1776189136 技能

通过命令行安装

skillhub install youtube-transcribe-1776189136

下载

⬇ 下载 youtube-transcribe v1.0.0(免费)

文件大小: 8.81 KB | 发布时间: 2026-4-15 11:16

v1.0.0 最新 2026-4-15 11:16
Initial release: smart YouTube transcription with caption extraction + multi-backend Whisper fallback (MLX/faster-whisper/openai-whisper)

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部