返回顶部
h

html-markdownHTML转Markdown

Convert HTML to Markdown using MinerU's document processing engine. Transforms HTML pages and files into clean, readable Markdown format. Features: HTML to Markdown conversion preserving structure. Handles headings, lists, tables, links, and code blocks. Works with local files and URLs. Clean output suitable for documentation and content systems. Use when you need to: convert HTML to Markdown, transform a web page to .md format, migrate HTML content to Markdown-based systems, generate Markdown f

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.4.0
安全检测
已通过
142
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

html-markdown

HTML Markdown

使用 MinerU 将 HTML 文件转换为干净的 Markdown。对于本地 HTML 文件使用 extract;对于实时网页使用 crawl。

安装

bash
npm install -g mineru-open-api

或通过 Go (macOS/Linux):


go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

快速开始

bash

将本地 HTML 文件转换为 Markdown(需要令牌)


mineru-open-api extract page.html -o ./out/

将远程 HTML 文件转换为 Markdown(需要令牌)

mineru-open-api extract https://example.com/doc.html -o ./out/

通过爬取将实时网页转换为 Markdown(需要令牌)

mineru-open-api crawl https://example.com/article -o ./out/

身份验证

需要令牌:

bash
mineru-open-api auth # 交互式令牌设置
export MINERU_TOKEN=your-token # 或通过环境变量设置

在以下地址创建令牌:https://mineru.net/apiManage/token

功能

  • - 支持的输入:本地 .html 文件或 HTTP/HTTPS URL
  • 本地 .html 文件:使用 extract(需要令牌)
  • 实时网页 URL:使用 crawl(需要令牌)
  • flash-extract 不支持 HTML
  • 使用 --language 指定语言(默认:ch,英文使用 en)

注意事项

  • - HTML 输入始终需要令牌(不支持 flash-extract)
  • 对于包含 JavaScript 渲染的实时网页,建议使用 crawl
  • 默认输出到标准输出;使用 -o 保存到文件或目录
  • 所有进度/状态信息输出到标准错误;文档内容输出到标准输出
  • MinerU 由 OpenDataLab(上海人工智能实验室)开源:https://github.com/opendatalab/MinerU

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 html-markdown-1775983210 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 html-markdown-1775983210 技能

通过命令行安装

skillhub install html-markdown-1775983210

下载

⬇ 下载 html-markdown v0.4.0(免费)

文件大小: 1.93 KB | 发布时间: 2026-4-13 10:35

v0.4.0 最新 2026-4-13 10:35
SEO: expand description for better ClawHub vector search discovery

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部