返回顶部
d

docs-pdf文档转PDF

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.3
安全检测
已通过
464
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

docs-pdf

PDF 技能

使用 Python 库和 CLI 工具进行 PDF 操作的完整指南。

⚡ 功能速查表

所有支持操作的一行速查——快速找到合适的工具。

你想做什么命令/脚本一行示例
📖 提取文本scripts/extracttext.pypython scripts/extracttext.py doc.pdf
📊 提取表格 → Excel
scripts/extracttables.py | python scripts/extracttables.py report.pdf -o tables.xlsx | | 🔗 合并 PDF | scripts/mergepdfs.py | python scripts/mergepdfs.py *.pdf -o merged.pdf | | ✂️ 拆分 PDF | scripts/splitpdf.py | python scripts/splitpdf.py big.pdf --each | | 🔄 旋转页面 | scripts/batchconvert.py rotate | python scripts/batchconvert.py rotate input.pdf -d 90 | | 🔀 重新排序页面 | scripts/reorderpdf.py | python scripts/reorderpdf.py input.pdf --order 3,1,2,4- -o reordered.pdf | | 💧 添加文字水印 | scripts/watermark.py | python scripts/watermark.py doc.pdf -t 机密 | | 🖼️ 添加图片水印 | scripts/watermark.py | python scripts/watermark.py doc.pdf --image logo.png --alpha 0.3 | | 🔒 加密 PDF | pypdf(内联) | 参见下方密码保护 | | 📝 填写 PDF 表单 | scripts/fillpdfform.py | python scripts/fillpdfform.py form.pdf -o filled.pdf --set name=Alice | | 🔍 检查表单字段 | scripts/checkfillablefields.py | python scripts/checkfillablefields.py form.pdf | | 🖼️ OCR 扫描版 PDF | scripts/ocrpdf.py | python scripts/ocrpdf.py scan.pdf --lang eng | | 📄 从头创建 PDF | reportlab(内联) | 参见 references/create.md | | 📦 批量操作 | scripts/batchconvert.py | python scripts/batchconvert.py merge --help | | 📏 压缩/优化 | scripts/compresspdf.py | python scripts/compresspdf.py input.pdf -o output.pdf --quality medium | | ℹ️ 查看 PDF 信息 | scripts/pdfinfo.py | python scripts/pdfinfo.py input.pdf | | 🖼️→📄 图片转 PDF | scripts/imagestopdf.py | python scripts/imagestopdf.py photos/*.jpg -o album.pdf --page-size A4 | | 📄→🖼️ PDF 转图片 | scripts/pdftoimages.py | python scripts/pdftoimages.py input.pdf -o pages/ --format png --dpi 200 | | 🔎 比较两个 PDF | scripts/comparepdf.py | python scripts/comparepdf.py old.pdf new.pdf -o diff_report.html | | 🔧 修复损坏的 PDF | scripts/repairpdf.py | python scripts/repairpdf.py broken.pdf -o fixed.pdf | | 🔤 列出字体 | scripts/listfonts.py | python scripts/listfonts.py input.pdf |

💡 使用 --help 运行任何脚本以查看所有可用选项。


快速决策指南

你需要什么?
├── 从头创建新 PDF → reportlab(参见 references/create.md)
├── 提取文本/表格 → pdfplumber(参见 references/extract.md)
├── 合并/拆分/旋转页面 → pypdf 或 qpdf CLI
├── 重新排序页面 → scripts/reorder_pdf.py
├── 添加水印/加密/保护 → pypdf
├── 填写 PDF 表单 → pdf-lib (JS) 或 pypdf(参见 FORMS.md)
├── 从 PDF 提取图片 → pdfimages CLI 或 pypdf
├── OCR 扫描版 PDF → pdf2image + pytesseract
├── 压缩/减小文件大小 → scripts/compress_pdf.py (qpdf + pypdf)
├── 查看 PDF 信息/元数据 → scripts/pdf_info.py
├── 图片转 PDF → scripts/imagestopdf.py (reportlab)
├── PDF 转图片 → scripts/pdftoimages.py (pdf2image)
├── 比较/差异两个 PDF → scripts/compare_pdf.py
├── 修复损坏的 PDF → scripts/repair_pdf.py (qpdf + pypdf)
└── 列出 PDF 中的字体 → scripts/list_fonts.py

安装

Linux (Ubuntu/Debian)

bash

Python 库


pip install pypdf pdfplumber reportlab pdf2image pytesseract Pillow --break-system-packages

系统工具

sudo apt-get install -y poppler-utils tesseract-ocr qpdf

中文 OCR

sudo apt-get install -y tesseract-ocr-chi-sim tesseract-ocr-chi-tra

Node.js(表单填写)

npm install pdf-lib

macOS (Homebrew)

bash

系统工具(OCR 和 CLI 操作必需)


brew install qpdf poppler tesseract

重要:非英文 OCR 必须单独安装语言包

brew install tesseract-lang

Python 库

pip install pypdf pdfplumber reportlab pdf2image pytesseract Pillow --break-system-packages

Node.js(表单填写)

npm install pdf-lib

⚠️ macOS 注意: tesseract-lang 必须单独安装,否则中文/日文等非英文 OCR 会失败。安装后运行 tesseract --list-langs 确认可用语言。

验证安装

bash

检查 Python 库


python3 -c import pypdf, pdfplumber, reportlab, PIL; print(✓ Python libs OK)

检查系统工具

which qpdf && echo ✓ qpdf OK || echo ✗ qpdf not installed which tesseract && echo ✓ tesseract OK || echo ✗ tesseract not installed which pdftotext && echo ✓ poppler OK || echo ✗ poppler not installed

检查 OCR 语言

tesseract --list-langs 2>/dev/null | head -5

核心操作

读取和提取文本

python
import pdfplumber

with pdfplumber.open(document.pdf) as pdf:
for page in pdf.pages:
print(page.extract_text())

→ 高级提取选项,参见 references/extract.md

提取表格 → DataFrame

python
import pdfplumber, pandas as pd

with pdfplumber.open(report.pdf) as pdf:
for page in pdf.pages:
for table in page.extract_tables():
df = pd.DataFrame(table[1:], columns=table[0])
print(df)

合并 PDF

python
from pypdf import PdfWriter, PdfReader

writer = PdfWriter()
for path in [a.pdf, b.pdf, c.pdf]:
writer.append(PdfReader(path))
with open(merged.pdf, wb) as f:
writer.write(f)

拆分 PDF

python
from pypdf import PdfReader, PdfWriter

reader = PdfReader(input.pdf)
for i, page in enumerate(reader.pages):
w = PdfWriter()
w.add_page(page)
with open(fpage_{i+1}.pdf, wb) as f:
w.write(f)

旋转页面

python
reader = PdfReader(scan.pdf)
writer = PdfWriter()
for page in reader.pages:
page.rotate(90) # 90 / 180 / 270
writer.add_page(page)
with open(rotated.pdf, wb) as f:
writer.write(f)

密码保护

python
from pypdf import PdfReader, PdfWriter

reader = PdfReader(doc.pdf)
writer = PdfWriter()
for page in reader.pages:
writer.add_page(page)
writer.encrypt(userpass, ownerpass, use_128bit=False) # AES-256
with open(encrypted.pdf, wb) as f:
writer.write(f)



CLI 快速参考 (qpdf)

bash

合并


qpdf --empty --pages a.pdf b.pdf -- merged.pdf

提取第 1-5 页

qpdf input.pdf --pages . 1-5 -- out.pdf

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 docs-pdf-1776121339 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 docs-pdf-1776121339 技能

通过命令行安装

skillhub install docs-pdf-1776121339

下载

⬇ 下载 docs-pdf v1.0.3(免费)

文件大小: 49.96 KB | 发布时间: 2026-4-15 12:31

v1.0.3 最新 2026-4-15 12:31
**Expanded PDF utilities and tools.**

- Added scripts for compressing, inspecting, repairing, and reordering PDFs, as well as font listing and PDF comparison.
- New conversion tools: images-to-PDF and PDF-to-images scripts included.
- README and skill trigger description updated to reflect new operations: compress/optimize, info/metadata, compare, repair, convert, reorder, and font listing.
- Installation instructions updated (now requires Pillow for image conversions).
- Quick decision guide and feature table extended to cover all new tools.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部