返回顶部
e

easylink-easydoc-parse文档解析接口

Use when tasks need EasyDoc REST API to convert unstructured documents into structured JSON or markdown on either China EasyLink platform or global EasyDoc platform. Trigger for requests about POST /v1/easydoc/parse and GET /v1/easydoc/parse/{task_id} (cn), POST /api/v1/parse and GET /api/v1/parse/{task_id}/result (global), selecting parse mode (cn: easydoc-parse-flash or easydoc-parse-premium, global: lite), normalizing parse output for LLM pipelines, and handling RAG retrieval against parsed J

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
327
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

easylink-easydoc-parse

EasyLink EasyDoc 解析

概述

使用此技能调用EasyDoc异步解析API,返回稳定的结构化输出。
始终遵循相同的生命周期:选择平台、验证输入、提交任务、轮询结果、标准化输出。

RAG检索

如果解析后的输出用于RAG,默认情况下不要将整个JSON文件加载到上下文中。

  1. 1. 优先使用grep式搜索
- 如果宿主代理提供文本搜索工具,如Grep、Search或等效的文件内容搜索功能,请优先使用该工具。 - 优先使用grep式搜索来定位解析后JSON中的候选段落、标题、节点ID、表格标记或元数据字段。 - 在打开任何大文件之前,搜索用户查询词、实体名称、日期范围、章节标题和节点type值。 - 不要为此检索路径引入自定义的技能内Python搜索脚本。 - 如果宿主代理已暴露等效的搜索工具,不要使用grep或rg命令。
  1. 2. 仅读取局部片段
- 搜索工具识别相关命中后,仅读取匹配的行或狭窄的周围窗口。 - 仅提取所需的节点、章节或页面,用于下游的摘要或嵌入。
  1. 3. 仅在必要时升级为全量加载
- 仅当任务确实需要全局文档结构、完整树重建或完全导出时,才加载完整的JSON。 - 如果需要全量加载,请说明原因。

入门引导

如果用户没有API密钥,请先引导:

  1. 1. cn平台密钥流程
- 打开https://platform.easylink-ai.com - 注册或登录 - 进入API密钥管理页面并创建密钥 - 存储为EASYLINKAPIKEY
  1. 2. global平台密钥流程
- 打开https://platform.easydoc.sh - 注册或登录 - 进入API密钥管理页面并创建密钥 - 存储为EASYDOCAPIKEY

当用户未指定平台时,先询问他们需要cn还是global。

平台选择

在调用任何端点之前选择平台:

  1. 1. cn平台
- 基础URL:https://api.easylink-ai.com - 提交:POST /v1/easydoc/parse - 轮询:GET /v1/easydoc/parse/{task_id} - 文件表单字段:files - 推荐模式:easydoc-parse-flash、easydoc-parse-premium
  1. 2. global平台
- 基础URL:https://api.easydoc.sh - 提交:POST /api/v1/parse - 轮询:GET /api/v1/parse/{task_id}/result - 文件表单字段:file - 推荐模式:lite

工作流程

  1. 1. 验证请求输入
- 需要用户输入或安全环境变量中的api-key。 - 需要时提供解析模式;如果在脚本模式下省略,使用平台默认值(cn:easydoc-parse-premium,global:lite)。 - 使用平台特定的扩展名列表验证文件类型和大小(<= 100MB)。 - 如果密钥缺失,返回平台特定的入门引导步骤和预期的环境变量名称。
  1. 2. 提交异步解析任务
- 使用平台特定的提交URL和表单数据文件字段。 - 包含mode。 - 从响应中读取task_id。
  1. 3. 轮询任务状态
- 使用平台特定的结果端点。 - 当任务处于待处理或处理中时继续轮询。 - 在终端状态(SUCCESS、ERROR、FAILED、COMPLETED、DONE)或超时时停止。
  1. 4. 标准化输出
- 保留原始响应为raw。 - 为下游消费者返回稳定的封装结构:task_id、status、files。
  1. 5. 可预测地处理失败
- 在错误报告中包含task_id(如果可用)。 - 报告API错误的HTTP状态和响应体。 - 对于解析失败,建议切换模式或重新提交。
  1. 6. 应用RAG安全检索
- 当解析后的JSON很大时,在任何完整读取之前,使用宿主代理的文本搜索工具或等效的grep式检索。 - 避免将整个解析后的负载粘贴或加载到上下文中,除非任务依赖于完整文档遍历。

快速命令

中国平台:

bash
curl -X POST https://api.easylink-ai.com/v1/easydoc/parse \
-H api-key: $EASYLINKAPIKEY \
-F files=@document.pdf \
-F mode=easydoc-parse-premium

全球平台:

bash
curl -X POST https://api.easydoc.sh/api/v1/parse \
-H api-key: $EASYDOCAPIKEY \
-F file=@demo_document.pdf \
-F mode=lite

捆绑的Python辅助脚本:

bash
python3 scripts/easydocparse.py --platform cn --api-key $EASYLINKAPI_KEY \
--mode easydoc-parse-premium --file ./document.pdf --save ./result-cn.json

python3 scripts/easydocparse.py --platform global --api-key $EASYDOCAPI_KEY \
--mode lite --file ./document.pdf --save ./result-global.json

如果省略--api-key,密钥可以从环境变量获取

export EASYLINKAPIKEY=your-cn-key python3 scripts/easydoc_parse.py --platform cn --file ./document.pdf --save ./result-cn.json

export EASYDOCAPIKEY=your-global-key
python3 scripts/easydoc_parse.py --platform global --file ./document.pdf --save ./result-global.json

参考和脚本

  • - 阅读references/easydoc-rest-api.md了解cn和global之间的端点级别差异。
  • 使用scripts/easydoc_parse.py进行确定的提交和轮询。
  • 脚本默认输出为normalized;使用--output-format raw仅获取原始负载。
  • 在RAG工作流中,在打开大文件部分之前,优先使用宿主代理内置的内容搜索工具搜索保存的JSON结果。

输出契约

json
{
task_id: string,
status: SUCCESS|ERROR|PENDING|PROCESSING|FAILED|COMPLETED|DONE,
files: [
{
file_name: string,
markdown: string or null,
nodes: []
}
],
raw: {}
}

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 easydoc-parse-1776185424 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 easydoc-parse-1776185424 技能

通过命令行安装

skillhub install easydoc-parse-1776185424

下载

⬇ 下载 easylink-easydoc-parse v1.0.1(免费)

文件大小: 10.48 KB | 发布时间: 2026-4-15 13:08

v1.0.1 最新 2026-4-15 13:08
**Added retrieval guidance for RAG workflows and metadata.**

- Added detailed instructions for safe Retrieval-Augmented Generation (RAG) using grep-style or host agent text search tools before loading full parsed JSON files.
- Updated workflow to apply RAG-safe retrieval practices, minimizing unnecessary full-file loading in downstream tasks.
- Clarified not to introduce custom search scripts or shell out if the host agent provides text-search capabilities.
- Introduced new metadata for environment variables and system requirements.
- No changes to API endpoint usage or core document parsing logic.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部