PDF Parser Skill
基于 MinerU 提供 PDF 解析能力。
功能
- - PDF 解析: 将 PDF 转换为 Markdown 格式
- 公式识别: 支持 LaTeX 公式提取
- 表格识别: 自动识别并转换表格结构
- OCR: 支持图片型 PDF 文字识别
- 多语言: 支持中文、英文,日文、韩文等
⚠️ 安装前必读
使用本技能即表示:
- 1. 你愿意提供你的 MinerU API Token (
MINERU_TOKEN) - Token 会被发送给 https://mineru.net/
- 确认 MinerU 服务可信,接受其隐私政策
- 已在本地源码中确认无额外意外行为
前提条件
1. 安装依赖
CODEBLOCK0
2. 获取 MinerU Token
访问 注册并获取 API Token。
3. 设置环境变量
Windows (PowerShell):
CODEBLOCK1
macOS / Linux:
CODEBLOCK2
支持的引擎
| 引擎 | 说明 |
|---|
| vlm | VLM 引擎(默认) |
| pipeline |
管道引擎 |
| MinerU-HTML | HTML 输出 |
快速开始
CODEBLOCK3
选项
| 参数 | 说明 | 默认值 |
|---|
| -f, --files | 本地 PDF 文件 | - |
| --engine |
解析引擎 | vlm |
| --lang | 语言 (ch/en/ja/ko) | ch |
| --wait | 等待解析完成 | 否 |
环境变量
| 变量 | 必填 | 说明 |
|---|
| MINERU_TOKEN | 是 | MinerU API Token |
输出
解析结果保存在 ~/.openclaw/MinerU_Results/ 目录下。
工作流
- 1. 设置
MINERU_TOKEN 环境变量 - 执行解析命令
- 等待解析完成
- 读取 full.md 分析内容
- 根据内容重命名目录
技能名称: pdf-parser
详细描述:
PDF 解析技能
基于 MinerU 提供 PDF 解析能力。
功能
- - PDF 解析: 将 PDF 转换为 Markdown 格式
- 公式识别: 支持 LaTeX 公式提取
- 表格识别: 自动识别并转换表格结构
- OCR: 支持图片型 PDF 文字识别
- 多语言: 支持中文、英文、日文、韩文等
⚠️ 安装前必读
使用本技能即表示:
- 1. 你愿意提供你的 MinerU API Token (MINERU_TOKEN)
- Token 会被发送至 https://mineru.net/
- 确认 MinerU 服务可信,并接受其隐私政策
- 已在本地源码中确认无额外意外行为
前提条件
1. 安装依赖
bash
pip install requests
2. 获取 MinerU Token
访问 注册并获取 API Token。
3. 设置环境变量
Windows (PowerShell):
powershell
$env:MINERU_TOKEN = your-token-here
macOS / Linux:
bash
export MINERU_TOKEN=your-token-here
支持的引擎
| 引擎 | 说明 |
|---|
| vlm | VLM 引擎(默认) |
| pipeline |
管道引擎 |
| MinerU-HTML | HTML 输出 |
快速开始
bash
解析 PDF (默认 vlm 引擎)
python scripts/mineru_api.py -f
--wait
指定引擎
python scripts/mineru_api.py -f --engine pipeline --wait
选项
| 参数 | 说明 | 默认值 |
|---|
| -f, --files | 本地 PDF 文件 | - |
| --engine |
解析引擎 | vlm |
| --lang | 语言 (ch/en/ja/ko) | ch |
| --wait | 等待解析完成 | 否 |
环境变量
| 变量 | 必填 | 说明 |
|---|
| MINERU_TOKEN | 是 | MinerU API Token |
输出
解析结果保存在 ~/.openclaw/MinerU_Results/ 目录下。
工作流
- 1. 设置 MINERU_TOKEN 环境变量
- 执行解析命令
- 等待解析完成
- 读取 full.md 分析内容
- 根据内容重命名目录