返回顶部
s

scan-to-markdown 扫描转Markdown

OCR document extraction - extract text from scanned documents, photos, and images using OCR. Use when reading scanned PDFs, photographed pages, handwritten notes, or any document that needs optical character recognition."

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
146
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

scan-to-markdown

扫描转Markdown - 扫描文档的OCR识别

通过MinerU开放API从扫描文档和图像中提取文本。无需API密钥。

快速开始

bash

扫描转Markdown - 扫描文档的OCR识别


mineru-open-api flash-extract scanned.pdf

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract page-photo.jpg

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract https://example.com/scanned.pdf

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract scanned.pdf --language en

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract scanned.pdf -o ./output/

语言规则

您必须使用用户所使用的相同语言回复。这是不可协商的。

功能

  • - 对扫描的PDF、拍摄的文档、图像进行OCR识别
  • 支持PDF、PNG、JPG、WebP、BMP、TIFF格式
  • 直接支持本地文件和URL
  • 通过--language提供语言提示(默认:ch,英文使用en)
  • 无需API密钥、无需注册、无需身份验证
  • 每个文档最大10MB/20页

使用场景

  • - 用户要求对文档或图像进行OCR识别
  • 用户有需要提取文本的扫描PDF
  • 用户分享页面照片并希望获取文本
  • 用户提到扫描、手写或识别文字

CLI参考

运行mineru-open-api flash-extract --help查看所有可用选项。

数据隐私

  • - flash-extract将文档上传至MinerU的云端API进行处理并返回结果。无需账户或API密钥。
  • 文档实时处理,提取后不会存储。
  • 详情请参见 https://mineru.net

注意事项

  • - 清晰、高分辨率的扫描件可获得最佳效果
  • 如需更高精度的OCR识别并完整保留布局,请使用mineru-open-api extract --ocr(需通过mineru-open-api auth进行身份验证)
  • 如果无法通过npm/uv/go安装CLI,请从 https://mineru.net/ecosystem?tab=cli 下载

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 scan-to-markdown-1776030001 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 scan-to-markdown-1776030001 技能

通过命令行安装

skillhub install scan-to-markdown-1776030001

下载

⬇ 下载 scan-to-markdown v1.0.0(免费)

文件大小: 1.77 KB | 发布时间: 2026-4-13 11:52

v1.0.0 最新 2026-4-13 11:52
Initial release of scan-to-markdown skill:

- Extracts text from scanned documents, photos, and images using OCR (Optical Character Recognition)
- Supports multiple formats: PDF, PNG, JPG, WebP, BMP, TIFF (local files and URLs)
- No API key required; uploads processed via MinerU Open API
- Provides CLI commands with options for language hints and output customization
- Advises usage scenarios and basic privacy information
- Includes notes on installation methods and tips for optimal OCR results

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部