AI短视频选题追踪系统

依赖安装

首次使用前，检查并安装所有依赖。按顺序执行：

1. CLI 工具

CODEBLOCK0

2. 依赖技能（通过 clawhub 安装）

CODEBLOCK1

如果 clawhub 未安装：INLINECODE0

3. 环境配置

钉钉 MCP Server：

1. 打开 https://mcp.dingtalk.com/#/detail?mcpId=9555&detailType=marketMcpDetail
点击「获取 MCP Server 配置」，复制 Streamable HTTP URL
注册到 mcporter：

CODEBLOCK2

Twitter Cookie：

1. 在浏览器登录 x.com，从 DevTools → Application → Cookies 获取 auth_token 和 INLINECODE2
配置到 ~/.config/bird/config.json5：

{
  authToken: "<你的auth_token>",
  ct0: "<你的ct0>"
}

⚠️ 当前版本 bird 不会自动读取 config.json5，CLI 调用时仍需通过 --auth-token 和 --ct0 参数传入。

4. 验证安装

CODEBLOCK4

数据架构

钉钉AI表格结构

Base 名称：INLINECODE6

需要 4 张数据表，首次运行时自动创建（参见 references/setup-guide.md）：

表名	用途
YouTube博主	追踪的油管频道列表
Twitter博主

表结构详见 references/table-schema.md。

工作流

一、首次初始化

仅第一次使用时执行，步骤详见 references/setup-guide.md：

1. 创建钉钉AI表格 Base
创建 4 张数据表（含字段定义）
填入初始博主列表
将 baseId 和各 tableId 保存到 INLINECODE10

二、定时抓取（每小时执行）

按顺序执行：

1. 读取配置

CODEBLOCK5

读取 baseId、各 tableId、各字段 fieldId。

2. 抓取 YouTube 内容

对「YouTube博主」表中状态为「活跃」的每个博主：

CODEBLOCK6

3. 抓取 Twitter 内容

对「Twitter博主」表中状态为「活跃」的每个博主：

CODEBLOCK7

对每条推文，检查 fetch 表是否已存在（用原文链接去重），新内容写入 fetch 表。

4. 写入 fetch 表的格式

CODEBLOCK8

三、选题分析（每次抓取后执行）

1. 读取待分析内容

CODEBLOCK9

2. 主题聚合

分析所有「待分析」记录，按以下规则聚合成选题：

- 关键词匹配：相同关键词标签的内容归为同一选题
语义相似：标题或摘要讨论同一事件/技术的合并
跨平台加权：YouTube + Twitter 同时出现的话题热度更高

3. 热度评分规则

满分 100，计算维度：

维度	权重
相关内容数量	25%
跨平台覆盖（YouTube+Twitter都有）

20% |
| 跨博主覆盖（多人提到） | 20% |
| 内容深度（长推文/视频 vs 短推文） | 15% |
| 时效性（越新越高） | 10% |
| 主流媒体报道（通过搜索验证） | 10% |

4. 搜索背景信息

对每个选题用可用的搜索工具（如 Tavily、web search 等）补充背景知识。搜索关键词 + 当前年份，取新闻类结果。

5. 生成选题建议

每条选题包含：

- 🎯 目标受众 — 这个视频谁会看
⏱ 建议时长 — 短视频多长合适
📐 内容结构 — 分几段讲什么（3-5个要点）
多个标题参考 — 至少3个不同角度的标题

6. 写入选题分析表

CODEBLOCK10

7. 设置关联

关键：关联字段写入必须用 {"linkedRecordIds":[...]} 格式，不能直接传数组：

CODEBLOCK11

8. 更新 fetch 记录状态

将已关联到选题的 fetch 记录标记为「已分析」。
对不值得做选题的内容（非AI相关、过于轻量）标记为「已忽略」。

踩坑记录

详见 references/gotchas.md，包含钉钉 API 的坑和 bird/yt-dlp 使用注意事项。

主题分类选项

- 大模型（GPT/Claude/Gemini/开源模型等）
AI应用（自动驾驶/医疗/教育/创意工具等）
AI编程（Copilot/Codex/代码生成等）
AI硬件（GPU/芯片/机器人/传感器等）
AI政策（监管/伦理/安全/就业影响等）
AI创业（融资/新公司/商业模式等）
AI开源（开源模型/框架/数据集等）
其他

聚合策略补充

当同一话题被多条内容覆盖时，将相关内容全部关联到同一选题。选题标题应反映聚合后的更大视角，而非单条内容的标题。

示例：Sam Altman 的 GPT-5.4 推文 + Codex Security 转推 + NVIDIA 算力扩展推文 + Mollick 的算力经济学分析 → 聚合为「OpenAI一周三连发：GPT-5.4 + Codex Security + 算力军备竞赛」

AI短视频选题追踪系统

依赖安装

首次使用前，检查并安装所有依赖。按顺序执行：

1. CLI 工具

bash

mcporter — MCP Server 调用工具

npm install -g mcporter

bird — Twitter/X CLI

npm install -g @steipete/bird

yt-dlp — YouTube 视频/字幕下载

pip install yt-dlp

2. 依赖技能（通过 clawhub 安装）

bash

钉钉 AI 表格操作

clawhub install dingtalk-ai-table

YouTube 字幕抓取

clawhub install youtube-watcher

如果 clawhub 未安装：npm install -g clawhub

3. 环境配置

钉钉 MCP Server：

1. 打开 https://mcp.dingtalk.com/#/detail?mcpId=9555&detailType=marketMcpDetail
点击「获取 MCP Server 配置」，复制 Streamable HTTP URL
注册到 mcporter：

bash
mcporter config add dingtalk-ai-table --url <你的URL>

Twitter Cookie：

1. 在浏览器登录 x.com，从 DevTools → Application → Cookies 获取 auth_token 和 ct0
配置到 ~/.config/bird/config.json5：

json5
{
authToken: <你的auth_token>,
ct0: <你的ct0>
}

⚠️ 当前版本 bird 不会自动读取 config.json5，CLI 调用时仍需通过 --auth-token 和 --ct0 参数传入。

4. 验证安装

bash
mcporter --version
mcporter list dingtalk-ai-table --schema # 确认出现 listbases / createrecords 等新版 tools
bird check
yt-dlp --version

数据架构

钉钉AI表格结构

Base 名称：AI短视频选题

需要 4 张数据表，首次运行时自动创建（参见 references/setup-guide.md）：

表名	用途
YouTube博主	追踪的油管频道列表
Twitter博主

表结构详见 references/table-schema.md。

工作流

一、首次初始化

仅第一次使用时执行，步骤详见 references/setup-guide.md：

1. 创建钉钉AI表格 Base
创建 4 张数据表（含字段定义）
填入初始博主列表
将 baseId 和各 tableId 保存到 references/config.json

二、定时抓取（每小时执行）

按顺序执行：

1. 读取配置

bash
cat {baseDir}/references/config.json

读取 baseId、各 tableId、各字段 fieldId。

2. 抓取 YouTube 内容

对「YouTube博主」表中状态为「活跃」的每个博主：

bash

获取最新3个视频ID

yt-dlp --flat-playlist --print %(id)s %(title)s -I 1:3 https://www.youtube.com/@{频道ID}/videos

对每个视频，先检查 fetch 表是否已存在（用原文链接去重）

mcporter call dingtalk-ai-table query_records --args { baseId:,tableId:, keyword:youtube.com/watch?v= } --output json

如果不存在，抓取字幕

python3 {youtube-watcher-baseDir}/scripts/get_transcript.py https://www.youtube.com/watch?v=

用字幕内容生成摘要，写入 fetch 表

3. 抓取 Twitter 内容

对「Twitter博主」表中状态为「活跃」的每个博主：

bash
bird user-tweets @{用户名} -n 5 --plain --auth-token --ct0

对每条推文，检查 fetch 表是否已存在（用原文链接去重），新内容写入 fetch 表。

4. 写入 fetch 表的格式

bash
mcporter call dingtalk-ai-table create_records --args {
baseId:,
tableId:,
records:[{
cells:{
<来源fieldId>:YouTube 或 Twitter,
<博主名称fieldId>:博主名,
<标题fieldId>:内容标题,
<内容摘要fieldId>:200字以内摘要,
<原文链接fieldId>:完整URL,
<发布时间fieldId>:YYYY-MM-DD,
<抓取时间fieldId>:YYYY-MM-DD HH:mm,
<内容类型fieldId>:视频/推文/长推文/转推评论,
<关键词标签fieldId>:逗号分隔的标签,
<处理状态fieldId>:待分析
}
}]
} --output json

三、选题分析（每次抓取后执行）

1. 读取待分析内容

bash
mcporter call dingtalk-ai-table query_records --args {
baseId:,tableId:,
filters:{operator:and,operands:[
{operator:eq,operands:[<处理状态fieldId>,<待分析optionId>]}
]}
} --output json

2. 主题聚合

分析所有「待分析」记录，按以下规则聚合成选题：

- 关键词匹配：相同关键词标签的内容归为同一选题
语义相似：标题或摘要讨论同一事件/技术的合并
跨平台加权：YouTube + Twitter 同时出现的话题热度更高

3. 热度评分规则

满分 100，计算维度：

维度	权重
相关内容数量	25%
跨平台覆盖（YouTube+Twitter都有）

20% |
| 跨博主覆盖（多人提到） | 20% |
| 内容深度（长推文/视频 vs 短推文） | 15% |
| 时效性（越新越高） | 10% |
| 主流媒体报道（通过搜索验证） | 10% |

4. 搜索背景信息

对每个选题用可用的搜索工具（如 Tavily、web search 等）补充背景知识。搜索关键词 + 当前年份，取新闻类结果。

5. 生成选题建议

每条选题包含：

- 🎯 目标受众 — 这个视频谁会看
⏱ 建议时长 — 短视频多长合适
📐 内容结构 — 分几段讲什么（3-5个要点）
多个标题参考 — 至少3个不同角度的标题

6. 写入选题分析表

bash
mcporter call dingtalk-ai-table create_records --args {
baseId:,
tableId:,
records:[{
cells:{
<主题fieldId>:emoji + 主题标题,
<热度评分fieldId>:85,
<相关内容数fieldId>:3,
<来源博主fieldId>:博主1, 博主2,
<主题分类fieldId>:大模型/AI应用/AI编程/AI硬件/AI政策/AI创业/AI开源/其他,
<背景信息fieldId>:背景描述...,
<选题建议fieldId>:完整建议...,
<分析时间fieldId>:YYYY-MM-DD HH:mm,
<状态fieldId>:待审核
}
}]
} --output json

7. 设置关联

关键：关联字段写入必须用 {linkedRecordIds:[...]} 格式，不能直接传数组：

bash
mcporter call dingtalk-ai-table update_records --args {
baseId:,
tableId:,
records:[{
recordId:<选题recordId>,
cells:{
<相关内容fieldId>:{linkedRecordIds:[,]}
}
}]
} --output json

8. 更新 fetch 记录状态

将已关联到选题的 fetch 记录标记为「已分析」。
对不值得做选题的内容（非AI相关、过于轻量）标记为「已忽略」。

踩坑记录

详见 references/gotchas.md，包含钉钉 API 的坑和 bird/yt-dlp 使用注意事项。

ai-topic-scoutAI选题追踪

ai-topic-scout

AI短视频选题追踪系统

依赖安装

1. CLI 工具

2. 依赖技能（通过 clawhub 安装）

3. 环境配置

4. 验证安装

数据架构

钉钉AI表格结构

工作流

一、首次初始化

二、定时抓取（每小时执行）

1. 读取配置

2. 抓取 YouTube 内容

3. 抓取 Twitter 内容

4. 写入 fetch 表的格式

三、选题分析（每次抓取后执行）

1. 读取待分析内容

2. 主题聚合

3. 热度评分规则

4. 搜索背景信息

5. 生成选题建议

6. 写入选题分析表

7. 设置关联

8. 更新 fetch 记录状态

踩坑记录

主题分类选项

聚合策略补充

AI短视频选题追踪系统

依赖安装

1. CLI 工具

mcporter — MCP Server 调用工具

bird — Twitter/X CLI

yt-dlp — YouTube 视频/字幕下载

2. 依赖技能（通过 clawhub 安装）

钉钉 AI 表格操作

YouTube 字幕抓取

3. 环境配置

4. 验证安装

数据架构

钉钉AI表格结构

工作流

一、首次初始化

二、定时抓取（每小时执行）

1. 读取配置

2. 抓取 YouTube 内容

获取最新3个视频ID

对每个视频，先检查 fetch 表是否已存在（用原文链接去重）

如果不存在，抓取字幕

用字幕内容生成摘要，写入 fetch 表

3. 抓取 Twitter 内容

4. 写入 fetch 表的格式

三、选题分析（每次抓取后执行）

1. 读取待分析内容

2. 主题聚合

3. 热度评分规则

4. 搜索背景信息

5. 生成选题建议

6. 写入选题分析表

7. 设置关联

8. 更新 fetch 记录状态

踩坑记录

主题分类选项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement