返回顶部
p

pdf-toolkitPDF工具集

Run a local script to work with PDF files, DOCX documents, OCR, and text-to-speech. Use the read tool to load this SKILL.md, then exec the uv run command inside it. Do NOT use sessions_spawn. Triggers: read pdf, extract text from pdf, merge pdfs, split pdf, rotate pdf, ocr pdf, read docx, create docx, text to speech, convert to mp3, pdf info, pdf pages.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.0.3
安全检测
已通过
597
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pdf-toolkit

系统依赖

  • - 必须已安装 uv,因为该技能通过 uv run 执行,且 uv 会安装 src/main.py 中声明的 Python 依赖。
  • tts 需要 ffmpeg,因为语音输出会经过标准化处理,并通过 ffmpeg 写入为 .mp3 文件。
  • ocr 需要 tesseract,因为它负责对扫描页面图像执行实际的光学字符识别。
  • ocr 还需要 pdfimages,因为它负责在将页面图像传递给 tesseract 之前,从 PDF 中提取页面图像;pdfimages 来自 poppler。
  • convert 可选 pandoc,因为它能在基于文本的转换可行时,实现多种文档格式之间的转换。
  • convert 可选 libreoffice 作为 pandoc 的替代方案,因为它能处理 pandoc 可能支持不佳的文档转换。

文件访问与网络行为

  • - 该技能对调用者提供的文件路径进行操作。它可以读取和写入调用者提供的任何主机路径;不限于 OpenClaw 工作区。
  • 命令示例中的 /root/.openclaw/workspace/... 路径仅表示技能入口点的位置。它们不限制技能可以访问的文件。
  • tts 命令使用 edge-tts,它会将输入文本通过网络发送到外部文本转语音服务以生成音频。
  • 除非您愿意将敏感或私密文本发送到外部主机,否则请勿对这类文本使用 tts。
  • 所有其他命令均在主机本地运行,受下文所述的可选本地二进制文件影响。

技能:PDF 工具包

使用时机

  • - 用户想要从 PDF 中提取文本、表格或图像。
  • 用户想要获取 PDF 的元数据或页数。
  • 用户想要合并、拆分或旋转 PDF。
  • 用户想要从纯文本或 Markdown 创建新的 PDF。
  • 用户想要读取或写入 DOCX 文件。
  • 用户想要对扫描版 PDF 进行 OCR(需要主机上安装 tesseract)。
  • 用户想要将文本或文档转换为 MP3 音频文件(需要主机上安装 ffmpeg)。
  • 用户想要在文档格式之间进行转换(需要主机上安装 pandoc 或 libreoffice)。
  • 用户想要检查哪些可选系统工具可用。

禁止使用时机

  • - 用户想要以可视化方式查看或渲染 PDF——请使用 PDF 查看器。
  • 用户想要填写 PDF 表单字段——本技能不支持 AcroForms。
  • 用户想要就地编辑现有 PDF 的文本——请使用专用 PDF 编辑器。

命令

检查可用工具

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py doctor

获取 PDF 元数据和页数

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py info

从 PDF 中提取文本

bash

所有页面

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py extract-text

指定页面(从1开始编号,逗号分隔或范围)

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py extract-text --pages 1,3,5-8

从 PDF 中提取表格

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py extract-tables uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py extract-tables --pages 2-4

从 PDF 中提取图像

bash

默认保存到当前目录

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py extract-images uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py extract-images --output-dir /path/to/output

合并 PDF

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py merge [ ...] --output merged.pdf

拆分 PDF

bash

拆分为单独的页面

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py split --output-dir /path/to/output

提取页面范围到新的 PDF

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py split --pages 2-5 --output extracted.pdf

旋转 PDF 中的页面

bash

将所有页面顺时针旋转90度

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py rotate --degrees 90 --output rotated.pdf

旋转指定页面

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py rotate --degrees 180 --pages 1,3 --output rotated.pdf

从文本创建 PDF

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py create-pdf --text Hello, world! --output hello.pdf uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py create-pdf --file input.txt --output document.pdf

读取 DOCX 文件

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py read-docx

写入 DOCX 文件

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py write-docx --text Content here --output document.docx uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py write-docx --file input.txt --output document.docx

对扫描版 PDF 进行 OCR(需要 tesseract)

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py ocr uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py ocr --pages 1-3 --lang eng

将文本或文档转换为语音(需要 ffmpeg)

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py tts --text Hello, world! --output speech.mp3 uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py tts --file input.txt --output speech.mp3 uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py tts --file document.pdf --output speech.mp3 uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py tts --text Hello --voice en-GB-SoniaNeural --output speech.mp3

转换文档格式(需要 pandoc 或 libreoffice)

bash uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py convert path> --output path>

示例

bash

检查 PDF


uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py info report.pdf

提取第1-3页的文本

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py extract-text report.pdf --pages 1-3

合并两个 PDF

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py merge a.pdf b.pdf --output combined.pdf

对扫描文档进行 OCR

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py ocr scan.pdf

读取 Word 文档

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py read-docx report.docx

文本转 MP3

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py tts --text Welcome to the future. --output welcome.mp3

检查此主机上可用的工具

uv run /root/.openclaw/workspace/skills/pdf-toolkit/src/main.py doctor

聊天交付

  • - 当此技能在支持文件附件的聊天界面(如 Telegram)中使用时,任何生成的输出文件在成功创建或转换后,都应作为附件发送回用户。
  • 这适用于创建文件的命令

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pdf-toolkit-1776194222 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pdf-toolkit-1776194222 技能

通过命令行安装

skillhub install pdf-toolkit-1776194222

下载

⬇ 下载 pdf-toolkit v0.0.3(免费)

文件大小: 20.81 KB | 发布时间: 2026-4-15 10:40

v0.0.3 最新 2026-4-15 10:40
### v0.0.3 Changelog

- Added "Chat Delivery" section to SKILL.md with guidelines for sending generated files as chat attachments and cleaning up temporary files.
- Clarified file delivery and deletion behavior for output files in chat interfaces.
- No functional code or command changes; documentation update only.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部