返回顶部
a

agent-paddleocr-visionPaddleOCR文档理解

Multi-language document understanding with PaddleOCR

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.0
安全检测
已通过
241
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

agent-paddleocr-vision

Agent PaddleOCR Vision

具备智能体操作的OCR——仅基于PaddleOCR实现。 自动分类文档并提供可操作提示。

功能概述

  • - 通过 PaddleOCR云API 进行OCR提取(需配置凭证)
  • 支持11种文档类型:发票、名片、收据、表格、合同、身份证、护照、银行对账单、驾驶证、税务表单、通用文档
  • 提供带结构化参数的操作建议
  • 支持批量处理
  • 可生成可搜索PDF(带边界框对齐)

快速开始

bash

安装依赖


pip3 install -r scripts/requirements.txt

配置PaddleOCR API

export PADDLEOCRDOCPARSINGAPIURL=https://your-api.paddleocr.com/layout-parsing export PADDLEOCRACCESSTOKEN=your_token

处理单个文件

python3 scripts/doc_vision.py --file-path ./invoice.jpg --pretty --make-searchable-pdf

批量处理

bash
python3 scripts/doc_vision.py --batch-dir ./inbox --output-dir ./out

输出说明

完整JSON模式及集成指南请参见 docs/README.zh.md。

支持类型

类型操作
发票创建支出、归档、税务申报
名片
添加联系人、保存vCard | | 收据 | 创建支出、分摊账单 | | 表格 | 导出CSV、分析数据 | | 合同 | 摘要、提取日期、标记义务 | | 身份证 | 提取身份信息、验证年龄 | | 护照 | 存储护照信息、检查有效期 | | 银行对账单 | 分类交易、生成报告 | | 驾驶证 | 存储驾照信息、检查有效期 | | 税务表单 | 税务摘要、建议抵扣项 | | 通用文档 | 摘要、翻译、关键词搜索 |

配置说明

必需的环境变量:

  • - PADDLEOCRDOCPARSINGAPIURL — 以 /layout-parsing 结尾的API端点
  • PADDLEOCRACCESSTOKEN — 访问令牌

可选配置:

  • - PADDLEOCRDOCPARSING_TIMEOUT — 默认600秒

可搜索PDF

使用 --make-searchable-pdf 参数时,通过边界框将OCR文本层嵌入并与原始布局对齐。需要 pdf2image + poppler(系统级)以及 reportlab、pypdf、pillow(Python库)。

完整文档

详细用法、故障排除及开发指南以多语言版本存放于 docs/ 目录:

  • - 中文: docs/README.zh.md
  • English: docs/README.en.md
  • Español: docs/README.es.md
  • العربية: docs/README.ar.md

许可证

MIT-0



专为OpenClaw打造。 让您的智能体看得见、能行动。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 agent-paddleocr-vision-1776075303 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 agent-paddleocr-vision-1776075303 技能

通过命令行安装

skillhub install agent-paddleocr-vision-1776075303

下载

⬇ 下载 agent-paddleocr-vision v1.1.0(免费)

文件大小: 54.45 KB | 发布时间: 2026-4-14 15:56

v1.1.0 最新 2026-4-14 15:56
- Documentation moved to the new docs/ directory with multi-language support (Arabic, English, Spanish, Chinese).
- Removed template files for document types (e.g., bank_statement, business_card, invoice, etc.).
- Cleaned up project structure by deleting unused and redundant files.
- README and integration details now consolidated and easier to navigate.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部