扫描转Markdown - 扫描文档的OCR识别

通过MinerU开放API从扫描文档和图像中提取文本。无需API密钥。

快速开始

bash

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract scanned.pdf

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract page-photo.jpg

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract https://example.com/scanned.pdf

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract scanned.pdf --language en

扫描转Markdown - 扫描文档的OCR识别

mineru-open-api flash-extract scanned.pdf -o ./output/

语言规则

您必须使用用户所使用的相同语言回复。这是不可协商的。

功能

- 对扫描的PDF、拍摄的文档、图像进行OCR识别
支持PDF、PNG、JPG、WebP、BMP、TIFF格式
直接支持本地文件和URL
通过--language提供语言提示（默认：ch，英文使用en）
无需API密钥、无需注册、无需身份验证
每个文档最大10MB/20页

使用场景

- 用户要求对文档或图像进行OCR识别
用户有需要提取文本的扫描PDF
用户分享页面照片并希望获取文本
用户提到扫描、手写或识别文字

CLI参考

运行mineru-open-api flash-extract --help查看所有可用选项。

数据隐私

- flash-extract将文档上传至MinerU的云端API进行处理并返回结果。无需账户或API密钥。
文档实时处理，提取后不会存储。
详情请参见 https://mineru.net

注意事项

- 清晰、高分辨率的扫描件可获得最佳效果
如需更高精度的OCR识别并完整保留布局，请使用mineru-open-api extract --ocr（需通过mineru-open-api auth进行身份验证）
如果无法通过npm/uv/go安装CLI，请从 https://mineru.net/ecosystem?tab=cli 下载

scan-to-markdown 扫描转Markdown

scan-to-markdown

Scan to Markdown - OCR for Scanned Docs

Quick Start

Language Rule

Capabilities

When to Use

CLI Reference

Data Privacy

Notes

扫描转Markdown - 扫描文档的OCR识别

快速开始

扫描转Markdown - 扫描文档的OCR识别

扫描转Markdown - 扫描文档的OCR识别

扫描转Markdown - 扫描文档的OCR识别

扫描转Markdown - 扫描文档的OCR识别

扫描转Markdown - 扫描文档的OCR识别

语言规则

功能

使用场景

CLI参考

数据隐私

注意事项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

scan-to-markdown 扫描转Markdown

scan-to-markdown

Scan to Markdown - OCR for Scanned Docs

Quick Start

Language Rule

Capabilities

When to Use

CLI Reference

Data Privacy

Notes

扫描转Markdown - 扫描文档的OCR识别

快速开始

扫描转Markdown - 扫描文档的OCR识别

扫描转Markdown - 扫描文档的OCR识别

扫描转Markdown - 扫描文档的OCR识别

扫描转Markdown - 扫描文档的OCR识别

扫描转Markdown - 扫描文档的OCR识别

语言规则

功能

使用场景

CLI参考

数据隐私

注意事项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement