Version	Changes
2.0.0	Modular architecture, improved workflow, browser DOM extraction
1.0.0

Tool	Purpose	Install
curl	Download files	Built-in (Windows: \curl.exe\)
ffmpeg

Input Type	Detection	Action
Video link (\/video/\)	URL pattern	Full workflow
Image note (\/note/\)

Model	Size	5-min Video (CPU)	Accuracy	Use Case
tiny	75MB	~30s	Fair	Quick preview
base

Stage	Issue	Solution
Step 1	Short URL fails	Check link completeness, remove share text
Step 1

Module	Purpose
douyin-fetcher	Video fetching only
douyin-transcriber

抖音转录 - 视频转录套件

用于转录抖音视频的完整解决方案。提取音频、将语音转为文本，并生成结构化摘要。

版本历史

版本	变更内容
2.0.0	模块化架构、改进工作流程、浏览器DOM提取
1.0.0

初始版本，基础转录功能 |

架构

\\\
用户输入（抖音链接/文件）
│
▼
┌─────────────────────────────────────────┐
│ 工作流程编排器 │
├─────────────────────────────────────────┤
│ 步骤1：获取器 → 获取视频文件 │
│ 步骤2：转录器 → 提取并转换 │
│ 步骤3：分析器 → 结构化输出 │
│ 步骤4：输出器 → 保存结果 │
└─────────────────────────────────────────┘
\\\

核心功能

- 视频获取：基于浏览器的DOM提取，获取CDN链接
音频提取：基于ffmpeg的音频转换
语音转文字：Whisper ASR，支持多种模型选择
内容分析：自动结构化转录文本，提取关键点
多格式支持：视频链接、本地文件、图文笔记

前置条件

工具	用途	安装方式
curl	下载文件	内置（Windows：\curl.exe\）
ffmpeg

Docker Whisper（推荐）：
\\\ash
docker run -d -p 9000:9000 --name whisper-asr onerahmet/openai-whisper-asr-webservice:latest
\\\

工作流程

步骤0：输入分类

输入类型	检测方式	操作
视频链接（\/video/\)	URL模式	完整工作流程
图文笔记（\/note/\)

步骤1：获取视频

1.1 解析短链接

\\\ash

Windows PowerShell

curl.exe -sL -o NUL -w %{url_effective} https://v.douyin.com/xxx/

macOS/Linux

curl -sL -o /dev/null -w %{url_effective} https://v.douyin.com/xxx/ \\\

输出：\https://www.douyin.com/video/7616020798351871284\

1.2 打开视频页面

\\\
browser(action=open, profile=openclaw, url=https://www.douyin.com/video/{VIDEO_ID})
\\\

等待10-15秒，确保页面完全加载。

1.3 提取视频链接（浏览器DOM方法）

\\\javascript
browser(action=act, targetId=PAGE_ID, request={
kind: evaluate,
fn: (() => {
const entries = performance.getEntriesByType(resource);
const videoEntries = entries.filter(e => {
const name = e.name.toLowerCase();
return name.includes(douyinvod) &&
(name.includes(.mp4) || name.includes(video));
});
if (videoEntries.length > 0) {
const video = videoEntries[videoEntries.length - 1];
return {
url: video.name,
type: video.name.includes(.mp4) ? mp4 : dash
};
}
return null;
})()
})
\\\

重要提示：

- \ct\ 操作需要嵌套的 \

equest\ 对象，包含 \kind\ 和 \n\

- 错误写法：\rowser(action=act, fn=...)\
正确写法：\rowser(action=act, request={kind: evaluate, fn: ...})\

1.4 下载视频

\\\ash
curl.exe -L -H Referer: https://www.douyin.com/ -o video.mp4
\\\

必须添加Referer头，否则返回403错误。

步骤2：转录音频

2.1 提取音频

\\\ash

对于MP4视频

ffmpeg -i video.mp4 -ar 16000 -ac 1 -c:a pcm_s16le audio.wav -y

对于DASH视频（需要合并）

ffmpeg -i video.mp4 -i audio.mp4 -c copy merged.mp4 -y ffmpeg -i merged.mp4 -ar 16000 -ac 1 -c:a pcm_s16le audio.wav -y \\\

参数说明：

- \-ar 16000\：16kHz采样率（Whisper要求）
\-ac 1\：单声道
\-c:a pcm_s16le\：16位PCM编码

2.2 使用Docker Whisper转录

\\\ash
curl.exe -X POST http://localhost:PORT/asr -F audio_file=@audio.wav
\\\

2.3 备选方案：本地Whisper

\\\ash
python -m whisper audio.wav --model small --language zh
\\\

模型选择：

模型	大小	5分钟视频（CPU）	准确度	使用场景
tiny	75MB	约30秒	一般	快速预览
base

142MB | 约1分钟 | 良好 | 日常使用 |
| small | 466MB | 约3分钟 | 较好 | 推荐 |
| medium | 1.5GB | 约8分钟 | 最佳 | 高精度需求 |

步骤3：分析内容

智能体处理转录文本并生成：

1. 修正转录错误

- 纠正同音字 - 修正说话人名称 - 删除填充词

2. 结构化内容

- 添加段落分隔 - 创建章节

3. 提取关键点

- 主要观点 - 重要引用

4. 生成标签

- 3-5个主题标签

步骤4：保存输出

转录文本格式

\\\markdown

{标题}

作者: {作者}
来源: 抖音
日期: {日期}
转录时间: {转录日期}

摘要

{摘要内容}

正文

{带段落的转录内容}

要点

- {关键点1}
{关键点2}
{关键点3}

故障排除

阶段	问题	解决方案
步骤1	短链接失败	检查链接完整性，删除分享文本
步骤1

图文笔记处理

图文笔记（\/note/\) 无需转录：

\\\

1. browser(action=open, profile=openclaw, url=图文笔记链接)
browser(action=snapshot)
从截图中提取内容
保存到输出目录

\\\

边界情况

- 文章链接（\/article/\)：使用浏览器截图，无需转录
抖音AI摘要：从页面提取作为补充
其他平台：使用yt-dlp处理YouTube/Bilibili
直播流：不支持

douyin-transcribe抖音转录工具

douyin-transcribe

Douyin Transcribe - Video Transcription Suite

Version History

Architecture

Core Features

Prerequisites

Workflow

Step 0: Input Classification

Step 1: Fetch Video

1.1 Resolve Short URL

Windows PowerShell

macOS/Linux

1.2 Open Video Page

1.3 Extract Video URL (Browser DOM Method)

1.4 Download Video

Step 2: Transcribe Audio

2.1 Extract Audio

For MP4 videos

For DASH videos (need merge)

2.2 Transcribe with Docker Whisper

2.3 Alternative: Local Whisper

Step 3: Analyze Content

Step 4: Save Output

Transcript Format

{Title}

摘要

正文

要点

标签

File Naming Convention

Troubleshooting

Image Note Handling

Edge Cases

Related Modules

License

抖音转录 - 视频转录套件

版本历史

架构

核心功能

前置条件

工作流程

步骤0：输入分类

步骤1：获取视频

1.1 解析短链接

Windows PowerShell

macOS/Linux

1.2 打开视频页面

1.3 提取视频链接（浏览器DOM方法）

1.4 下载视频

步骤2：转录音频

2.1 提取音频

对于MP4视频

对于DASH视频（需要合并）

2.2 使用Docker Whisper转录

2.3 备选方案：本地Whisper

步骤3：分析内容

步骤4：保存输出

转录文本格式

{标题}

摘要

正文

要点

标签

文件命名规则

故障排除

图文笔记处理

边界情况

相关模块

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement