返回顶部
b

baoyu-url-to-markdown抓取URL转Markdown

Fetch any URL and convert to markdown using baoyu-fetch CLI (Chrome CDP with site-specific adapters). Built-in adapters for X/Twitter, YouTube transcripts, Hacker News threads, and generic pages via Defuddle. Handles login/CAPTCHA via interaction wait modes. Use when user wants to save a webpage as markdown.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.103.1
安全检测
已通过
1,246
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

baoyu-url-to-markdown

URL 转 Markdown

通过 baoyu-fetch CLI(Chrome CDP + 站点特定适配器)获取任意 URL,并将其转换为干净的 Markdown 格式。

CLI 配置

重要提示:CLI 源代码已内置于本技能的 scripts/vendor/baoyu-fetch/ 子目录中。

代理执行说明

  1. 1. 确定本 SKILL.md 文件所在的目录路径为 {baseDir}
  2. CLI 入口点 = {baseDir}/scripts/vendor/baoyu-fetch/src/cli.ts
  3. 解析 ${BUNX} 运行时:如果已安装 bun → 使用 bun;如果可用 npx → 使用 npx -y bun;否则建议安装 bun
  4. ${READER} = ${BUNX} {baseDir}/scripts/vendor/baoyu-fetch/src/cli.ts
  5. 将本文档中所有 ${READER} 替换为解析后的值

偏好设置(EXTEND.md)

检查 EXTEND.md 是否存在(优先级顺序):

bash

macOS、Linux、WSL、Git Bash


test -f .baoyu-skills/baoyu-url-to-markdown/EXTEND.md && echo project
test -f ${XDGCONFIGHOME:-$HOME/.config}/baoyu-skills/baoyu-url-to-markdown/EXTEND.md && echo xdg
test -f $HOME/.baoyu-skills/baoyu-url-to-markdown/EXTEND.md && echo user

powershell

PowerShell(Windows)


if (Test-Path .baoyu-skills/baoyu-url-to-markdown/EXTEND.md) { project }
$xdg = if ($env:XDGCONFIGHOME) { $env:XDGCONFIGHOME } else { $HOME/.config }
if (Test-Path $xdg/baoyu-skills/baoyu-url-to-markdown/EXTEND.md) { xdg }
if (Test-Path $HOME/.baoyu-skills/baoyu-url-to-markdown/EXTEND.md) { user }

路径位置
.baoyu-skills/baoyu-url-to-markdown/EXTEND.md项目目录
$HOME/.baoyu-skills/baoyu-url-to-markdown/EXTEND.md
用户主目录 |
结果操作
找到读取、解析、应用设置
未找到
必须运行首次设置(见下文)—— 不要静默创建默认值 |

EXTEND.md 支持:默认下载媒体 | 默认输出目录

首次设置(阻塞操作)

关键提示:当未找到 EXTEND.md 时,你必须使用 AskUserQuestion 询问用户的偏好,然后再创建 EXTEND.md。切勿在未询问的情况下使用默认值创建 EXTEND.md。这是一个阻塞操作 —— 在设置完成之前,不要进行任何转换。

使用 AskUserQuestion 在一次调用中提出所有问题:

问题 1 — 标题:媒体,问题:如何处理页面中的图片和视频?

  • - 每次都询问(推荐) — 保存 Markdown 后,询问是否下载媒体
  • 始终下载 — 始终将媒体下载到本地 imgs/ 和 videos/ 目录
  • 从不下载 — 在 Markdown 中保留原始远程 URL

问题 2 — 标题:输出,问题:默认输出目录?

  • - url-to-markdown(推荐) — 保存到 ./url-to-markdown/{domain}/{slug}.md
  • (用户可选择其他以输入自定义路径)

问题 3 — 标题:保存,问题:偏好设置保存位置?

  • - 用户(推荐) — ~/.baoyu-skills/(所有项目)
  • 项目 — .baoyu-skills/(仅此项目)

用户回答后,在所选位置创建 EXTEND.md,确认偏好设置已保存至 [路径],然后继续。

完整参考:references/config/first-time-setup.md

支持的键

默认值描述
downloadmediaaskask / 1 / 0ask = 每次提示,1 = 始终下载,0 = 从不
defaultoutput_dir
空 | 路径或空 | 默认输出目录(空 = ./url-to-markdown/) |

EXTEND.md → CLI 映射

EXTEND.md 键CLI 参数备注
downloadmedia: 1--download-media需要同时设置 --output
defaultoutput_dir: ./posts/
代理构建 --output ./posts/{domain}/{slug}.md | 代理生成路径,非直接 CLI 标志 |

值优先级

  1. 1. CLI 参数(--download-media、--output)
  2. EXTEND.md
  3. 技能默认值

功能特性

  • - 通过 baoyu-fetch CLI 使用 Chrome CDP 实现完整的 JavaScript 渲染
  • 站点特定适配器:X/Twitter、YouTube、Hacker News、通用(Defuddle)
  • 基于 URL 自动选择适配器,或使用 --adapter 强制指定
  • 交互门检测:Cloudflare、reCAPTCHA、hCAPTCHA、自定义挑战
  • 两种捕获模式:无头模式(默认)或带等待交互的交互模式
  • 带有 YAML 前置元数据的干净 Markdown 输出
  • 通过 --format json 支持结构化 JSON 输出
  • X/Twitter:提取推文、线程和带媒体的 X 文章
  • YouTube:提取转录/字幕、章节、封面图片
  • Hacker News:带正确嵌套的线程化评论解析
  • 通用:Defuddle 提取,附带 Readability 回退
  • 将图片和视频下载到本地目录
  • Chrome 配置文件持久化,支持已认证会话
  • 调试工件输出,便于故障排查

使用方法

bash

默认:无头捕获,Markdown 输出到标准输出


${READER}

保存到文件

${READER} --output article.md

保存并下载媒体

${READER} --output article.md --download-media

无头模式(显式)

${READER} --headless --output article.md

等待交互(登录/CAPTCHA)— 自动检测并继续

${READER} --wait-for interaction --output article.md

等待交互 — 手动控制(按 Enter 继续)

${READER} --wait-for force --output article.md

JSON 输出

${READER} --format json --output article.json

强制指定适配器

${READER} --adapter youtube --output transcript.md

连接到现有 Chrome

${READER} --cdp-url http://localhost:9222 --output article.md

调试工件

${READER} --output article.md --debug-dir ./debug/

选项

选项描述
<url>要获取的 URL
--output <path>
输出文件路径(默认:标准输出) | | --format | 输出格式:markdown(默认)或 json | | --json | --format json 的简写 | | --adapter | 强制适配器:x、youtube、hn 或 generic(默认:自动检测) | | --headless | 强制无头 Chrome(无可见窗口) | | --wait-for | 交互等待模式:none(默认)、interaction 或 force | | --wait-for-interaction | --wait-for interaction 的别名 | | --wait-for-login | --wait-for interaction 的别名 | | --timeout | 页面加载超时(默认:30000) | | --interaction-timeout | 登录/CAPTCHA 等待超时(默认:600000 = 10 分钟) | | --interaction-poll-interval | 交互检查轮询间隔(默认:1500) | | --download-media | 将图片/视频下载到本地 imgs/ 和 videos/,重写 Markdown 链接。需要

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 baoyu-url-to-markdown-1776181708 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 baoyu-url-to-markdown-1776181708 技能

通过命令行安装

skillhub install baoyu-url-to-markdown-1776181708

下载

⬇ 下载 baoyu-url-to-markdown v1.103.1(免费)

文件大小: 107.26 KB | 发布时间: 2026-4-15 13:45

v1.103.1 最新 2026-4-15 13:45
## 1.103.1 - 2026-04-13

### Fixes
- `baoyu-markdown-to-html`: decode HTML entities and strip tags from article summary
- `baoyu-post-to-weibo`: decode HTML entities and strip tags from article summary

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部