X Article 内容提取技能

能力

从 X/Twitter 链接中提取完整内容，支持三种场景：

场景	方法	说明
普通推文	xreach tweet	直接提取推文文本+媒体
X Article 长文

所有场景自动附带互动数据（浏览/赞/转发/收藏/评论数）。

触发条件

当用户要求提取 X/Twitter 内容时触发，包括但不限于：

- 「提取这条推文」「抓一下这个 X 链接」
「这条 X Article 讲了什么」
「帮我把这条推文内容拉出来」
直接给出 x.com / twitter.com 链接并要求分析内容

使用方式

1. 提取单条 X 链接

CODEBLOCK0

输出 JSON，包含：

- title: 标题
INLINECODE1: 作者
INLINECODE2: 完整内容
INLINECODE3: 互动数据
INLINECODE4: tweet / x_article / INLINECODE7
INLINECODE8: 内容字数

2. 提取并入库到内容工厂

CODEBLOCK1

自动将提取的内容写入内容工厂素材库（ObsidianAdapter），等同于在飞书群发链接 + 入库。

3. 批量提取

CODEBLOCK2

4. 仅解析 t.co 短链（不提取内容）

CODEBLOCK3

参数说明

参数	必填	说明
INLINECODE9	是	X/Twitter 链接（可多个）
INLINECODE10

否 | 提取后自动入库到内容工厂 | | --resolve | 否 | 仅解析 t.co 短链，不提取内容 | | --json | 否 | 输出原始 JSON（默认人类可读格式） | | --proxy | 否 | 代理地址（默认从环境变量 HTTPS_PROXY 读取） | | -v | 否 | 详细日志 |

依赖

- xreach (v0.3.0+): X/Twitter CLI，需已认证（xreach auth check）
Playwright (python): 用于抓取 X Article（pip install playwright && python3 -m playwright install chromium）
Firecrawl API Key: 用于抓取外部网页（环境变量 FIRECRAWL_API_KEY）
VPS 代理: X 在国内被屏蔽，需走代理

注意事项

- xreach 认证 cookie 保存在 ~/.config/xfetch/session.json，过期后需重新认证：INLINECODE19
Playwright 首次使用需安装浏览器：INLINECODE20
X Article 抓取需要 ~10 秒（Playwright 启动 + 页面渲染），普通推文 ~2 秒
如果 Playwright 失败，自动降级为 xreach thread 获取讨论上下文

X Article 内容提取技能

能力

从 X/Twitter 链接中提取完整内容，支持三种场景：

场景	方法	说明
普通推文	xreach tweet	直接提取推文文本+媒体
X Article 长文

所有场景自动附带互动数据（浏览/赞/转发/收藏/评论数）。

触发条件

当用户要求提取 X/Twitter 内容时触发，包括但不限于：

- 「提取这条推文」「抓一下这个 X 链接」
「这条 X Article 讲了什么」
「帮我把这条推文内容拉出来」
直接给出 x.com / twitter.com 链接并要求分析内容

使用方式

1. 提取单条 X 链接

bash
python3 ~/.openclaw/workspace/skills/x-article-extract/scripts/extract.py \
--url https://x.com/username/status/123456789

输出 JSON，包含：

- title: 标题
author: 作者
description: 完整内容
engagement: 互动数据
contenttype: tweet / xarticle / externalpage
wordcount: 内容字数

2. 提取并入库到内容工厂

bash
python3 ~/.openclaw/workspace/skills/x-article-extract/scripts/extract.py \
--url https://x.com/username/status/123456789 \
--ingest

自动将提取的内容写入内容工厂素材库（ObsidianAdapter），等同于在飞书群发链接 + 入库。

3. 批量提取

bash
python3 ~/.openclaw/workspace/skills/x-article-extract/scripts/extract.py \
--url https://x.com/a/status/111 \
--url https://x.com/b/status/222

4. 仅解析 t.co 短链（不提取内容）

bash
python3 ~/.openclaw/workspace/skills/x-article-extract/scripts/extract.py \
--resolve https://t.co/abc123

参数说明

参数	必填	说明
--url	是	X/Twitter 链接（可多个）
--ingest

否 | 提取后自动入库到内容工厂 | | --resolve | 否 | 仅解析 t.co 短链，不提取内容 | | --json | 否 | 输出原始 JSON（默认人类可读格式） | | --proxy | 否 | 代理地址（默认从环境变量 HTTPS_PROXY 读取） | | -v | 否 | 详细日志 |

依赖

- xreach (v0.3.0+): X/Twitter CLI，需已认证（xreach auth check）
Playwright (python): 用于抓取 X Article（pip install playwright && python3 -m playwright install chromium）
Firecrawl API Key: 用于抓取外部网页（环境变量 FIRECRAWLAPIKEY）
VPS 代理: X 在国内被屏蔽，需走代理

注意事项

- xreach 认证 cookie 保存在 ~/.config/xfetch/session.json，过期后需重新认证：xreach auth extract --cookie-source chrome
Playwright 首次使用需安装浏览器：python3 -m playwright install chromium
X Article 抓取需要 ~10 秒（Playwright 启动 + 页面渲染），普通推文 ~2 秒
如果 Playwright 失败，自动降级为 xreach thread 获取讨论上下文

x-article-extractX文章提取

x-article-extract

X Article 内容提取技能

能力

触发条件

使用方式

1. 提取单条 X 链接

2. 提取并入库到内容工厂

3. 批量提取

4. 仅解析 t.co 短链（不提取内容）

参数说明

依赖

注意事项

X Article 内容提取技能

能力

触发条件

使用方式

1. 提取单条 X 链接

2. 提取并入库到内容工厂

3. 批量提取

4. 仅解析 t.co 短链（不提取内容）

参数说明

依赖

注意事项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

x-article-extractX文章提取

x-article-extract

X Article 内容提取技能

能力

触发条件

使用方式

1. 提取单条 X 链接

2. 提取并入库到内容工厂

3. 批量提取

4. 仅解析 t.co 短链（不提取内容）

参数说明

依赖

注意事项

X Article 内容提取技能

能力

触发条件

使用方式

1. 提取单条 X 链接

2. 提取并入库到内容工厂

3. 批量提取

4. 仅解析 t.co 短链（不提取内容）

参数说明

依赖

注意事项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement