返回顶部
m

moark-doc-extraction文档文本提取

Extract and recognize text from documents, including PDF and DOCX files.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
114
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

moark-doc-extraction

文档提取

该技能允许用户使用外部GITEE AI API从文档(包括PDF和DOCX文件)中提取并识别文本。

使用方法

确保已安装所需依赖项(pip install requests requests-toolbelt)。使用捆绑脚本执行文档提取。

bash
python {baseDir}/scripts/performdocextraction.py --file /path/to/document.pdf --api-key YOUR_API

选项

该技能无需额外参数。

工作流程

  1. 1. 使用用户提供的参数执行performdocextraction.py脚本。
  2. 解析脚本输出,找到以EXTRACTIONRESULT:开头的行。
  3. 从该行中提取OCR结果(格式:EXTRACTIONRESULT: ...)。
  4. 使用Markdown语法向用户显示OCR结果:📖[EXTRACTION_RESULT Result]。

注意事项

  • - 如果GITEEAIAPIKEY为空,应提醒用户提供--api-key参数。
  • 请谨慎处理脚本输出,确保仅提取并显示相关信息,不添加任何额外评论或解释。
  • 应优化输出格式,使其更简洁易读,但不得更改或忽略结果内容。
  • 脚本输出中包含EXTRACTIONRESULT: - 提取该结果并使用Markdown图片语法显示:📖[EXTRACTIONRESULT Result]。
  • 始终在脚本输出中查找以EXTRACTION_RESULT:开头的行。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 moark-doc-extraction-1776055621 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 moark-doc-extraction-1776055621 技能

通过命令行安装

skillhub install moark-doc-extraction-1776055621

下载

⬇ 下载 moark-doc-extraction v1.0.0(免费)

文件大小: 3.76 KB | 发布时间: 2026-4-14 14:01

v1.0.0 最新 2026-4-14 14:01
Initial release of moark-doc-extraction.

- Supports extracting and recognizing text from PDF and DOCX documents using the GITEE AI API.
- Provides a script for document extraction via command line.
- Requires a valid GITEEAI_API_KEY for API access.
- Extraction results are parsed automatically and displayed in a clear, markdown-formatted output.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部