文档提取

该技能允许用户使用外部GITEE AI API从文档（包括PDF和DOCX文件）中提取并识别文本。

使用方法

确保已安装所需依赖项（pip install requests requests-toolbelt）。使用捆绑脚本执行文档提取。

bash
python {baseDir}/scripts/performdocextraction.py --file /path/to/document.pdf --api-key YOUR_API

选项

该技能无需额外参数。

工作流程

1. 使用用户提供的参数执行performdocextraction.py脚本。
解析脚本输出，找到以EXTRACTIONRESULT:开头的行。
从该行中提取OCR结果（格式：EXTRACTIONRESULT: ...）。
使用Markdown语法向用户显示OCR结果：📖[EXTRACTION_RESULT Result]。

注意事项

- 如果GITEEAIAPIKEY为空，应提醒用户提供--api-key参数。
请谨慎处理脚本输出，确保仅提取并显示相关信息，不添加任何额外评论或解释。
应优化输出格式，使其更简洁易读，但不得更改或忽略结果内容。
脚本输出中包含EXTRACTIONRESULT: - 提取该结果并使用Markdown图片语法显示：📖[EXTRACTIONRESULT Result]。
始终在脚本输出中查找以EXTRACTION_RESULT:开头的行。

moark-doc-extraction文档文本提取

moark-doc-extraction

Document Extraction

Usage

Options

Workflow

Notes

文档提取

使用方法

选项

工作流程

注意事项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

moark-doc-extraction文档文本提取

moark-doc-extraction

Document Extraction

Usage

Options

Workflow

Notes

文档提取

使用方法

选项

工作流程

注意事项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement