返回顶部
d

douyin-transcribe抖音转录工具

Douyin video transcription suite. Extract audio from Douyin/TikTok China videos, transcribe with Whisper, and analyze content. Supports video links, local files, and image notes. Trigger when user sends a Douyin link and asks for transcription, summary, or analysis.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.0.0
安全检测
已通过
339
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

douyin-transcribe

抖音转录 - 视频转录套件

用于转录抖音视频的完整解决方案。提取音频、将语音转为文本,并生成结构化摘要。

版本历史

版本变更内容
2.0.0模块化架构、改进工作流程、浏览器DOM提取
1.0.0
初始版本,基础转录功能 |

架构

\\\
用户输入(抖音链接/文件)


┌─────────────────────────────────────────┐
│ 工作流程编排器 │
├─────────────────────────────────────────┤
│ 步骤1:获取器 → 获取视频文件 │
│ 步骤2:转录器 → 提取并转换 │
│ 步骤3:分析器 → 结构化输出 │
│ 步骤4:输出器 → 保存结果 │
└─────────────────────────────────────────┘
\\\

核心功能

  • - 视频获取:基于浏览器的DOM提取,获取CDN链接
  • 音频提取:基于ffmpeg的音频转换
  • 语音转文字:Whisper ASR,支持多种模型选择
  • 内容分析:自动结构化转录文本,提取关键点
  • 多格式支持:视频链接、本地文件、图文笔记

前置条件

工具用途安装方式
curl下载文件内置(Windows:\curl.exe\)
ffmpeg
音频提取/合并 | \winget install Gyan.FFmpeg\ | | Whisper | 转录 | \pip install openai-whisper\ 或 Docker | | 浏览器 | 视频提取 | 需要OpenClaw配置文件 |

Docker Whisper(推荐):
\\\ash
docker run -d -p 9000:9000 --name whisper-asr onerahmet/openai-whisper-asr-webservice:latest
\\\

工作流程

步骤0:输入分类

输入类型检测方式操作
视频链接(\/video/\)URL模式完整工作流程
图文笔记(\/note/\)
URL模式 | 仅截图 | | 本地视频文件 | 文件路径 | 从步骤2开始 | | 文本输入 | 纯文本 | 从步骤3开始 |

步骤1:获取视频

1.1 解析短链接

\\\ash

Windows PowerShell


curl.exe -sL -o NUL -w %{url_effective} https://v.douyin.com/xxx/

macOS/Linux

curl -sL -o /dev/null -w %{url_effective} https://v.douyin.com/xxx/ \\\

输出:\https://www.douyin.com/video/7616020798351871284\

1.2 打开视频页面

\\\
browser(action=open, profile=openclaw, url=https://www.douyin.com/video/{VIDEO_ID})
\\\

等待10-15秒,确保页面完全加载。

1.3 提取视频链接(浏览器DOM方法)

\\\javascript
browser(action=act, targetId=PAGE_ID, request={
kind: evaluate,
fn: (() => {
const entries = performance.getEntriesByType(resource);
const videoEntries = entries.filter(e => {
const name = e.name.toLowerCase();
return name.includes(douyinvod) &&
(name.includes(.mp4) || name.includes(video));
});
if (videoEntries.length > 0) {
const video = videoEntries[videoEntries.length - 1];
return {
url: video.name,
type: video.name.includes(.mp4) ? mp4 : dash
};
}
return null;
})()
})
\\\

重要提示:

  • - \ct\ 操作需要嵌套的 \

equest\ 对象,包含 \kind\ 和 \ n\
  • - 错误写法:\rowser(action=act, fn=...)\
  • 正确写法:\rowser(action=act, request={kind: evaluate, fn: ...})\

1.4 下载视频

\\\ash
curl.exe -L -H Referer: https://www.douyin.com/ -o video.mp4
\\\

必须添加Referer头,否则返回403错误。

步骤2:转录音频

2.1 提取音频

\\\ash

对于MP4视频


ffmpeg -i video.mp4 -ar 16000 -ac 1 -c:a pcm_s16le audio.wav -y

对于DASH视频(需要合并)

ffmpeg -i video.mp4 -i audio.mp4 -c copy merged.mp4 -y ffmpeg -i merged.mp4 -ar 16000 -ac 1 -c:a pcm_s16le audio.wav -y \\\

参数说明:

  • - \-ar 16000\:16kHz采样率(Whisper要求)
  • \-ac 1\:单声道
  • \-c:a pcm_s16le\:16位PCM编码

2.2 使用Docker Whisper转录

\\\ash
curl.exe -X POST http://localhost:PORT/asr -F audio_file=@audio.wav
\\\

2.3 备选方案:本地Whisper

\\\ash
python -m whisper audio.wav --model small --language zh
\\\

模型选择:

模型大小5分钟视频(CPU)准确度使用场景
tiny75MB约30秒一般快速预览
base
142MB | 约1分钟 | 良好 | 日常使用 |
| small | 466MB | 约3分钟 | 较好 | 推荐 |
| medium | 1.5GB | 约8分钟 | 最佳 | 高精度需求 |

步骤3:分析内容

智能体处理转录文本并生成:

  1. 1. 修正转录错误
- 纠正同音字 - 修正说话人名称 - 删除填充词
  1. 2. 结构化内容
- 添加段落分隔 - 创建章节
  1. 3. 提取关键点
- 主要观点 - 重要引用
  1. 4. 生成标签
- 3-5个主题标签

步骤4:保存输出

转录文本格式

\\\markdown

{标题}

作者: {作者}
来源: 抖音
日期: {日期}
转录时间: {转录日期}



摘要

{摘要内容}



正文

{带段落的转录内容}



要点

  • - {关键点1}
  • {关键点2}
  • {关键点3}

标签

#{标签1} #{标签2} #{标签3}
\\\

文件命名规则

\\\
{VIDEO_ID}-抖音转录.md
\\\

故障排除

阶段问题解决方案
步骤1短链接失败检查链接完整性,删除分享文本
步骤1
JS返回null | 等待15-20秒后重试,增加超时时间 | | 步骤1 | 下载返回403 | 链接已过期,重新从浏览器获取 | | 步骤1 | DASH无音频 | 使用 \ fmpeg -i video -i audio -c copy\ 合并 | | 步骤2 | ffmpeg未安装 | \winget install Gyan.FFmpeg\ | | 步骤2 | Whisper服务停止 | \docker start whisper-asr\ | | 步骤2 | 转录速度慢 | 10分钟视频在CPU上需要15-20分钟 | | 步骤2 | 质量不佳 | 使用更大的模型(medium) |

图文笔记处理

图文笔记(\/note/\) 无需转录:

\\\

  1. 1. browser(action=open, profile=openclaw, url=图文笔记链接)
  2. browser(action=snapshot)
  3. 从截图中提取内容
  4. 保存到输出目录

\\\

边界情况

  • - 文章链接(\/article/\):使用浏览器截图,无需转录
  • 抖音AI摘要:从页面提取作为补充
  • 其他平台:使用yt-dlp处理YouTube/Bilibili
  • 直播流:不支持

相关模块

本技能可通过独立模块进行扩展:

模块用途
douyin-fetcher仅视频获取
douyin-transcriber
仅音频转录 |
| douyin-analyzer | 仅内容分析 |

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 douyin-video-transcribe-1776115876 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 douyin-video-transcribe-1776115876 技能

通过命令行安装

skillhub install douyin-video-transcribe-1776115876

下载

⬇ 下载 douyin-transcribe v2.0.0(免费)

文件大小: 10.7 KB | 发布时间: 2026-4-15 12:33

v2.0.0 最新 2026-4-15 12:33
v2.0.0 - Major upgrade: Modular architecture, browser DOM extraction, DASH support, Docker Whisper, structured output format, extended troubleshooting guide

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部