Content Collector - 链接内容自动收录技能
Overview
This skill enables automatic collection and archiving of content from shared links into a structured knowledge base.
Core Workflow:
CODEBLOCK0
When to Use
模式1:主动触发(显式关键词)
当用户消息包含以下
触发词时,立即执行收录:
- - "收录" / "转存" / "保存" / "存档" / "存一下" / "归档" / "备份" / "收藏"
- "存到知识库" / "加入知识库" / "转飞书"
示例:
- - "这个链接收录一下"
- "存到知识库"
- "转存这篇教程"
模式2:静默收录(自动检测)
在
群聊场景中,自动检测以下链接并静默收录:
- - 飞书文档/表格/Wiki(feishu.cn)
- 微信公众号文章(mp.weixin.qq.com)
- 技术博客/教程站点
- 知识分享类链接
静默收录条件:
- 1. 消息来自群聊(非私聊)
- 消息包含可识别的知识类链接
- 用户没有明确拒绝的意图
两种模式优先级:
CODEBLOCK1
Supported Link Types
| Type | Example | Fetch Method |
|---|
| WeChat Article | INLINECODE0 | kimifetch |
| Feishu Doc |
https://xxx.feishu.cn/docx/xxx | feishufetch_doc |
| Feishu Wiki |
https://xxx.feishu.cn/wiki/xxx | feishu
fetchdoc |
| Web Page | General URLs | kimi
fetch / webfetch |
Global Availability (全局可用配置)
生效范围:所有用户、所有群聊
本技能已配置为全局可用,支持以下对象:
| 对象类型 | 支持状态 | 说明 |
|---|
| 所有用户 | ✅ 可用 | 任何用户分享的链接均可被收录 |
| 所有群聊 |
✅ 可用 | 支持技能中心群、养虾群、学习群等所有群组 |
|
私聊消息 | ✅ 可用 | 用户私信分享链接也可触发收录 |
|
多渠道 | ✅ 可用 | 飞书、其他渠道统一支持 |
权限说明:
- - 任何用户均可触发收录(无需管理员权限)
- 收录的文档统一存储到指定的知识库目录
- 所有用户均可查看已收录的文档
Installation & Permission Check (安装与权限检查)
在正式使用本技能前,系统必须自动或引导用户完成以下权限校验,以确保流程不中断:
1. 飞书权限清单
| 权限项 | 验证工具 | 目的 |
|---|
| OAuth 授权 | INLINECODE3 | 获取操作飞书文档和表格的用户凭证 |
| 知识库写入权限 |
feishu_create_doc | 确保能在指定的 Space ID 下创建节点 |
|
多维表格编辑权限 |
feishu_bitable_app_table_record | 确保能向指定的 app_token 写入记录 |
|
图片上传权限 |
feishu_im_bot_upload | 允许将本地图片同步至飞书素材库 |
2. 预检流程 (Pre-flight Check)
每次“安装”或配置更新后,执行以下检查:
- 1. 验证 Space ID 可访问性:尝试在指定目录下获取节点列表。
- 验证 Table 结构:检查
关键词、原链接 等必需字段是否存在。 - 静默测试:如果权限不足,立即通过
feishu_oauth 弹出授权引导,而非在执行收录时报错。
Configuration
Before using, ensure these are configured in MEMORY.md:
CODEBLOCK2
Note:
- 1. This skill updates ONLY the configured knowledge base table. Do not create or update any other tables.
- All created documents must be saved under the designated Knowledge Base using wiki_node parameter.
- Global Access: 所有用户、所有群聊均可使用本技能,收录的文档对全员可见。
📚 知识库文档存储规则(必遵守)
所有收录的文档必须按照以下规则分类存储到知识库对应目录:
知识库目录结构
请参考各项目或团队定义的知识库标准目录结构进行存储。收录的文档通常存放在“素材”或“归档”类目录下。
文档分类映射规则
| 内容分类 | 存储目录 (wiki_node) | 命名前缀 | 示例 |
|---|
| 技术教程 | INLINECODE10 (内容文档) | 📖 | 📖 [标题] |
| 实战案例 |
F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🛠️ | 🛠️ [标题] |
| 产品文档 |
F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 📄 | 📄 [标题] |
| 学习笔记 |
F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 💡 | 💡 [标题] |
| 热点资讯 |
F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🔥 | 🔥 [标题] |
| 设计技能 |
F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🎨 | 🎨 [标题] |
| 工具推荐 |
F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🔧 | 🔧 [标题] |
| 训练营 |
F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🎓 | 🎓 [标题] |
文档命名规范
CODEBLOCK3
文档模板
CODEBLOCK4
自动更新素材索引
每次收录完成后,必须:
- 1. 更新多维表格 - 添加新记录到素材池表格
- 更新素材索引文档 - 在「📚 内容素材池文档索引」中添加条目
- 更新分类统计 - 更新各分类的文档数量和占比
Workflow
Step 1: Detect and Parse Link
Extract URL from user message using regex or direct extraction.
Step 2: Fetch Content
Choose appropriate fetch method based on URL pattern:
For WeChat articles:
CODEBLOCK5
For Feishu docs:
CODEBLOCK6
For general web pages:
CODEBLOCK7
Step 3: Analyze and Categorize
智能分类判断:
根据内容特征自动判断分类:
| 判断依据 | 分类 |
|---|
| 包含"安装/配置/部署/教程"等词 | 📖 技术教程 |
| 包含"案例/实战/项目/演示"等词 |
🛠️ 实战案例 |
| 包含"安全/公告/版本/功能"等词 | 📄 产品文档 |
| 包含"学习/成长/指南/笔记"等词 | 💡 学习笔记 |
| 包含"发布/新功能/热点"等词 | 🔥 热点资讯 |
| 包含"设计/Prompt/美学"等词 | 🎨 设计技能 |
| 包含"工具/CLI/插件"等词 | 🔧 工具推荐 |
| 包含"训练营/课程/教学"等词 | 🎓 训练营 |
Step 4: Process Images (图片处理)
When content contains images, download and upload them to Feishu:
Image Processing Workflow:
CODEBLOCK8
Fallback Strategy:
- - If image upload fails, keep original URL
- Add warning note in document
- Include original source link for reference
Step 5: Create Feishu Document (按知识库规则存储)
Convert processed markdown to Feishu document with proper organization:
CODEBLOCK9
存储目录映射:
| 分类 | wiki_node | 目录名 |
|---|
| 所有素材 | INLINECODE18 | 04-内容素材 |
IMPORTANT:
- 1. All documents MUST be created under the designated Knowledge Base using wiki_node parameter.
- Documents must follow the naming convention: INLINECODE19
- Documents must use the standard template with metadata section.
Step 6: Update Knowledge Base Table
Add record to the Bitable knowledge base (ONLY update this specific table):
CODEBLOCK10
Table Fields:
| Field | Type | Description |
|---|
| 关键词 | Text | Search keywords for the content |
| 内容分类 |
Single Select | Category: 📖技术教程/🛠️实战案例/📄产品文档/💡学习笔记/🔥热点资讯/🎨设计技能/🔧工具推荐/🎓训练营 |
| 文档标题 | Text | Title of the archived document |
| 来源 | Text | Original source name |
| 核心要点 | Text | Key points summary (3-5 items) |
| 飞书文档链接 | URL | Link to the created Feishu document |
| 原链接 | URL |
Original source URL - 新增字段,存储采集的原始链接 |
IMPORTANT: Only update the configured knowledge base table. Never create or modify other tables.
Step 7: Update Content Index Document
After creating the document and updating the table, MUST update the index document:
CODEBLOCK11
或者直接追加到索引文档的末尾:
feishu_update_doc(
doc_id="[Your Index Doc ID]",
mode="append",
markdown=f"""
| {original_title} | {source_name} | [查看]({new_doc_url}) |
"""
)
Content Categorization Guide
| Category | Emoji | Description | Examples |
|---|
| 技术教程 | 📖 | Step-by-step technical guides | Installation, configuration, API usage |
| 实战案例 |
🛠️ | Real-world implementation examples | Case studies, project demos |
|
产品文档 | 📄 | Product features, security notices | Release notes, security advisories |
|
学习笔记 | 💡 | Conceptual knowledge, methodologies | Best practices, architecture guides |
|
热点资讯 | 🔥 | Breaking news, releases | GPT-5.4, new features |
|
设计技能 | 🎨 | Design, prompts, aesthetics | AJ's prompts, design guides |
|
工具推荐 | 🔧 | Tools, CLI, plugins | gws, trae, autotools |
|
训练营 | 🎓 | Courses, bootcamps, tutorials | OpenClaw bootcamp |
分类判断优先级:
- 1. 优先根据用户指定分类
- 其次根据标题关键词
- 最后根据内容特征自动判断
- 不确定时标记为"待分类",请用户确认
Delete Record Process
When user replies "删除" or "删除 [keyword]":
CODEBLOCK13
Error Handling
Common Issues
| Error | Cause | Solution |
|---|
| Fetch timeout | Network issue or heavy content | Retry with longer timeout, or use alternative fetch method |
| Unauthenticated |
OAuth token expired or not authed | Trigger
feishu_oauth to refresh user credentials |
| Permission denied | No write access to Space/Table | Check if user/bot has 'Editor' role in Feishu |
| Content too long | Exceeds API limits | Truncate or split into multiple documents |
| Table update failed | Wrong app
token or tableid | Verify configuration in MEMORY.md |
| Field Missing | "原链接" field not in table | Add the field to Bitable manually or via API |
Recovery Steps
- 1. If fetch fails → Try alternative method (kimifetch → webfetch)
- If Feishu doc creation fails → Check OAuth status
- If table update fails → Verify table structure and field names
- Always report partial success (doc created but table not updated)
Response Template
收录成功响应(流式Post格式)
CODEBLOCK14
简洁输出示例:
CODEBLOCK15
静默收录响应(流式Post格式)
CODEBLOCK16
批量收录响应(流式Post格式)
CODEBLOCK17
输出原则:
- 1. 必须流式Post格式 - 使用 msg_type: post
- 只包含3个核心要素:
- 文件名称(📄 Emoji + 标题 + 日期)
- 文档亮点(💡 3-5条核心要点)
- 飞书链接(🔗 点击查看)
- 3. 不输出其他信息 - 不显示分类、不显示表格更新、不显示统计
- 保持简洁 - 每份文档3-5行内容
Best Practices
- 1. Always verify content was fetched correctly before creating documents
- Extract key insights from the content for the summary
- Use appropriate category based on content nature
- Generate relevant keywords for better searchability
- Keep source attribution clear for copyright respect
- Handle partial failures gracefully - document what succeeded and what failed
- Update index document - Every new document must be added to the index
- Follow naming convention - Use [Emoji] [Title] | [Date] format
- Store in correct directory - Use wiki_node to place in right category
收录完成检查清单 (Checklist)
每次收录必须完成以下所有步骤:
- - [ ] 执行权限预检(验证 OAuth 及 Space/Table 写入权限)
- [ ] 获取并处理原始内容(含图片)
- [ ] 智能分类并确定 Emoji 前缀
- [ ] 提取核心要点(3-5条)
- [ ] 生成关键词
- [ ] 创建飞书文档(使用标准模板,指定 wiki_node)
- [ ] 更新多维表格(添加完整记录,包含原链接字段)
- [ ] 更新文档索引(在素材索引中添加条目)
- [ ] 发送收录完成通知给用户
任何一步未完成,视为收录失败!
Integration with Memory
After each collection, update MEMORY.md:
CODEBLOCK18
This skill is part of the core knowledge management system. Execute with care and attention to detail.
附录:图片处理解决方案
问题
原始网页中的图片无法直接显示在飞书文档中(外链限制)
解决方案
方案1:自动下载上传(推荐)
实现步骤:
CODEBLOCK19
使用方式:
在创建文档之前调用:
CODEBLOCK20
方案2:保留原链接 + 备用方案
CODEBLOCK21
方案3:批量图片归档
创建一个独立的「图片资源库」多维表格:
CODEBLOCK22
建议实施顺序
- 1. 短期(立即):使用方案2,保留原链接并添加查看提示
- 中期(本周):实施方案1,自动下载上传核心文章的图片
- 长期(可选):建立独立的图片资源库管理系统
注意事项
- 1. 图片大小限制:飞书图片上传通常限制 10MB
- 格式支持:JPG、PNG、GIF 等常见格式
- 网络超时:下载图片时设置合理的超时时间(30秒)
- 失败处理:单张图片失败不应影响整篇文档收录
- 版权注意:确保有权限使用原网页中的图片
图片处理方案 v1.0 - 2026-03-05
Content Collector - 链接内容自动收录技能
概述
本技能能够自动收集和归档共享链接中的内容,并将其存入结构化的知识库中。
核心工作流程:
检测链接 → 获取内容 → 创建飞书文档 → 更新表格
使用时机
模式1:主动触发(显式关键词)
当用户消息包含以下
触发词时,立即执行收录:
- - 收录 / 转存 / 保存 / 存档 / 存一下 / 归档 / 备份 / 收藏
- 存到知识库 / 加入知识库 / 转飞书
示例:
模式2:静默收录(自动检测)
在
群聊场景中,自动检测以下链接并静默收录:
- - 飞书文档/表格/Wiki(feishu.cn)
- 微信公众号文章(mp.weixin.qq.com)
- 技术博客/教程站点
- 知识分享类链接
静默收录条件:
- 1. 消息来自群聊(非私聊)
- 消息包含可识别的知识类链接
- 用户没有明确拒绝的意图
两种模式优先级:
检测到主动触发词 → 立即收录(显式模式)
未检测到触发词但检测到链接 → 静默收录(隐式模式)
支持的链接类型
| 类型 | 示例 | 获取方式 |
|---|
| 微信文章 | https://mp.weixin.qq.com/s/xxx | kimifetch |
| 飞书文档 |
https://xxx.feishu.cn/docx/xxx | feishufetch_doc |
| 飞书Wiki | https://xxx.feishu.cn/wiki/xxx | feishu
fetchdoc |
| 网页 | 通用URL | kimi
fetch / webfetch |
全局可用配置
生效范围:所有用户、所有群聊
本技能已配置为全局可用,支持以下对象:
| 对象类型 | 支持状态 | 说明 |
|---|
| 所有用户 | ✅ 可用 | 任何用户分享的链接均可被收录 |
| 所有群聊 |
✅ 可用 | 支持技能中心群、养虾群、学习群等所有群组 |
|
私聊消息 | ✅ 可用 | 用户私信分享链接也可触发收录 |
|
多渠道 | ✅ 可用 | 飞书、其他渠道统一支持 |
权限说明:
- - 任何用户均可触发收录(无需管理员权限)
- 收录的文档统一存储到指定的知识库目录
- 所有用户均可查看已收录的文档
安装与权限检查
在正式使用本技能前,系统必须自动或引导用户完成以下权限校验,以确保流程不中断:
1. 飞书权限清单
| 权限项 | 验证工具 | 目的 |
|---|
| OAuth 授权 | feishuoauth | 获取操作飞书文档和表格的用户凭证 |
| 知识库写入权限 |
feishucreate_doc | 确保能在指定的 Space ID 下创建节点 |
|
多维表格编辑权限 | feishu
bitableapp
tablerecord | 确保能向指定的 app_token 写入记录 |
|
图片上传权限 | feishu
imbot_upload | 允许将本地图片同步至飞书素材库 |
2. 预检流程
每次安装或配置更新后,执行以下检查:
- 1. 验证 Space ID 可访问性:尝试在指定目录下获取节点列表。
- 验证 Table 结构:检查 关键词、原链接 等必需字段是否存在。
- 静默测试:如果权限不足,立即通过 feishu_oauth 弹出授权引导,而非在执行收录时报错。
配置
使用前,请确保在 MEMORY.md 中配置了以下内容:
markdown
Content Collector Config
- - 知识库表格: [你的 Bitable App Token] (Bitable app_token)
- 表格URL: [你的 Bitable 表格 URL]
- 默认表格ID: [你的 Table ID] (如果可用,将自动检测)
- 知识库空间ID: [你的 Space ID] (所有文档创建在此知识库下)
- 知识库URL: [你的知识库首页 URL]
- 内容分类: 技术教程, 实战案例, 产品文档, 学习笔记
- 全局访问: 所有用户可用,所有群聊可用
注意:
- 1. 本技能仅更新已配置的知识库表格。请勿创建或更新任何其他表格。
- 所有创建的文档必须使用 wiki_node 参数保存在指定的知识库下。
- 全局访问:所有用户、所有群聊均可使用本技能,收录的文档对全员可见。
📚 知识库文档存储规则(必遵守)
所有收录的文档必须按照以下规则分类存储到知识库对应目录:
知识库目录结构
请参考各项目或团队定义的知识库标准目录结构进行存储。收录的文档通常存放在素材或归档类目录下。
文档分类映射规则
| 内容分类 | 存储目录 (wiki_node) | 命名前缀 | 示例 |
|---|
| 技术教程 | F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 📖 | 📖 [标题] |
| 实战案例 |
F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🛠️ | 🛠️ [标题] |
| 产品文档 | F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 📄 | 📄 [标题] |
| 学习笔记 | F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 💡 | 💡 [标题] |
| 热点资讯 | F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🔥 | 🔥 [标题] |
| 设计技能 | F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🎨 | 🎨 [标题] |
| 工具推荐 | F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🔧 | 🔧 [标题] |
| 训练营 | F9pFw9dxTiXmpsk5bNlco704nag (内容文档) | 🎓 | 🎓 [标题] |
文档命名规范
[Emoji前缀] [原标题] | 收录日期
示例:
📖 OpenClaw保姆级教程 | 2026-03-08
🛠️ 火山方舟自动化报表案例 | 2026-03-08
🔥 GPT-5.4发布解读 | 2026-03-08
文档模板
markdown
[Emoji] [原标题]
📌 元信息
- - 来源:[原始来源]
- 原文链接:[原始URL]
- 收录时间:YYYY-MM-DD
- 内容分类:[技术教程/实战案例/产品文档/学习笔记/热点资讯/设计技能/工具推荐/训练营]
- 关键词:[关键词1, 关键词2, 关键词3]
📋 核心要点
[3-5条核心内容摘要]
📝 正文内容
[完整的转存内容]
🔗 相关链接
- - 原文链接:[原始URL]
- 知识库索引:[素材池文档索引链接]
📚
收录时间:YYYY-MM-DD
🏷️
分类:[分类名]
🔖
关键词:[关键词]
自动更新素材索引
每次收录完成后,必须:
- 1. 更新多维表格 - 添加新记录到素材池表格
- 更新素材索引文档 - 在「📚 内容素材池文档索引」中添加条目
- 更新分类统计 - 更新各分类的文档数量和占比
工作流程
步骤 1: 检测并解析链接
使用正则表达式或直接提取从用户消息中提取URL。
步骤 2: 获取内容
根据URL模式选择合适的获取方式:
对于微信文章:
python
kimi_fetch(url=https://mp.weixin.qq.com/s/xxx)
对于飞书文档:
python
feishufetchdoc(doc_id=https://xxx.feishu.cn