Doc2Slides
把 PDF、Word、Markdown 一键变成设计师级 PPT。10 秒出稿,无需设计能力。
📄 论文答辩 / 📊 周报月报 / 📋 技术文档培训 / 💡 创业路演
CODEBLOCK0
Done. 一行命令,PPT 生成在本地。
Why doc2slides?
| doc2slides | 模板方案 | AI 在线服务 |
|---|
| 排版 | 18 种布局 AI 自动匹配 | 固定 2-3 种 | 有限 |
| 图表 |
内置 SVG 饼图/柱状/进度环 | 手动插入 | 依赖模板 |
| 隐私 | 默认本地,可选 LLM | 本地 | 上传云端 |
| 费用 | 免费 | 免费 | 按次收费 |
| 画质 | 3x 高清 (3840×2160) | 标清 | 取决于套餐 |
| AI | GPT-4o / 智谱 / DeepSeek 可选 | 无 | 固定模型 |
Use Cases
- - 论文答辩 — 把论文 PDF 变成答辩 PPT,自动提炼要点
- 周报月报 — Markdown 周报一键幻灯片,数据自动配图表
- 技术分享 — 技术文档转培训材料,代码块自动排版
- 创业路演 — 商业计划书变路演 PPT,金字塔/矩阵布局
- 读书笔记 — 长文拆解成结构化幻灯片
Agent Trigger
User says any of → activate:
- - "把这个文档做成PPT" / "做个演示文稿"
- "Convert this PDF to slides"
- "Generate a presentation from..."
Workflow:
- 1. First time? INLINECODE0
- Missing deps? tell user INLINECODE1
- Ask: "有特殊要求吗?页数、风格、重点?没有我按默认来。"
- Locate input (path or URL)
- Generate:
cd ~/.openclaw/workspace/skills/doc2slides/scripts
python3 workflow.py --input <file> --output <file.pptx> [options]
- 6. Verify output, send to user
CLI Options
| Flag | Example |
|---|
| INLINECODE2 | Required. PDF / DOCX / MD path |
| INLINECODE3 |
Required. Output .pptx path |
|
--pages N | Limit slide count |
|
--instruction "..." | Custom guidance |
|
--style corporate | Color: corporate / tech / nature / warm / minimal / dark_purple / finance |
|
--theme AI | Auto color by topic |
|
--model gpt-4o | LLM for analysis |
|
--preview | Also generate PNG screenshots |
CODEBLOCK2
Layouts (18+)
| Category | Layouts |
|---|
| Data | Dashboard, Big Number, KPI Cards, Chart |
| Structure |
Pyramid, Comparison, 2x2 Matrix, Flow |
| Narrative | Timeline, Action Plan, Quote, Full-image |
| Content | Two-column, Three-column, Icon Grid, Vertical List |
| Visual | Progress Ring, Horizontal Bar, Stacked Cards |
Each section of your document gets auto-matched to the best layout.
Troubleshooting
| Problem | Fix |
|---|
| INLINECODE10 | INLINECODE11 |
| No browser for screenshots |
playwright install chromium |
| Chromium download timeout |
apt install google-chrome-stable |
| Output blank/broken | Add
--preview to debug HTML |
| Too slow for long docs |
--pages N to limit |
Pipeline
CODEBLOCK3
Default mode runs fully local — no CDN, no cloud. Optionally connect LLM providers (GPT-4o / 智谱 / DeepSeek) for smarter analysis when you configure API keys.
MIT-0 license.
Doc2Slides
将PDF、Word、Markdown一键转化为设计师级PPT。10秒出稿,无需设计能力。
📄 论文答辩 / 📊 周报月报 / 📋 技术文档培训 / 💡 创业路演
bash
安装与配置
clawhub install doc2slides
bash ~/.openclaw/workspace/skills/doc2slides/setup.sh
运行
python3 workflow.py --input report.pdf --output report.pptx
完成。一行命令,PPT在本地生成。
为什么选择doc2slides?
| doc2slides | 模板方案 | AI在线服务 |
|---|
| 排版 | 18种布局AI自动匹配 | 固定2-3种 | 有限 |
| 图表 |
内置SVG饼图/柱状图/进度环 | 手动插入 | 依赖模板 |
| 隐私 | 默认本地,可选LLM | 本地 | 上传云端 |
| 费用 | 免费 | 免费 | 按次收费 |
| 画质 | 3倍高清(3840×2160) | 标清 | 取决于套餐 |
| AI | GPT-4o / 智谱 / DeepSeek可选 | 无 | 固定模型 |
使用场景
- - 论文答辩 — 将论文PDF转化为答辩PPT,自动提炼要点
- 周报月报 — Markdown周报一键生成幻灯片,数据自动配图表
- 技术分享 — 技术文档转为培训材料,代码块自动排版
- 创业路演 — 商业计划书变为路演PPT,金字塔/矩阵布局
- 读书笔记 — 长文拆解为结构化幻灯片
Agent触发
用户说出以下任一内容 → 激活:
- - 把这个文档做成PPT / 做个演示文稿
- Convert this PDF to slides
- Generate a presentation from...
工作流程:
- 1. 首次使用?bash setup.sh --verify
- 缺少依赖?告知用户 bash setup.sh
- 询问:有特殊要求吗?页数、风格、重点?没有我按默认来。
- 定位输入文件(路径或URL)
- 生成:
bash
cd ~/.openclaw/workspace/skills/doc2slides/scripts
python3 workflow.py --input <文件> --output <文件.pptx> [选项]
- 6. 验证输出,发送给用户
CLI选项
| 标志 | 示例 |
|---|
| --input | 必需。PDF / DOCX / MD路径 |
| --output |
必需。输出.pptx路径 |
| --pages N | 限制幻灯片数量 |
| --instruction ... | 自定义指导 |
| --style corporate | 配色:corporate / tech / nature / warm / minimal / dark_purple / finance |
| --theme AI | 根据主题自动配色 |
| --model gpt-4o | 用于分析的LLM |
| --preview | 同时生成PNG截图 |
bash
示例:商务风格,8页,数据聚焦
python3 workflow.py --input report.pdf --output report.pptx \
--instruction 商务风格,重点突出数据,控制在8页,每页配图表
布局(18+种)
金字塔、对比、2x2矩阵、流程图 |
| 叙事 | 时间线、行动计划、引用、全图 |
| 内容 | 双栏、三栏、图标网格、垂直列表 |
| 视觉 | 进度环、水平条形图、堆叠卡片 |
文档的每个部分都会自动匹配最佳布局。
故障排除
| 问题 | 解决方法 |
|---|
| ModuleNotFoundError: pptx | pip3 install python-pptx |
| 无浏览器截图 |
playwright install chromium |
| Chromium下载超时 | apt install google-chrome-stable |
| 输出空白/损坏 | 添加 --preview 调试HTML |
| 长文档处理过慢 | 使用 --pages N 限制页数 |
处理流程
文档 → 分析 → 匹配布局 → 构建HTML → 渲染(3倍)→ PPTX
默认模式完全本地运行——无需CDN,无需云端。可选连接LLM提供商(GPT-4o / 智谱 / DeepSeek),配置API密钥后可实现更智能的分析。
MIT-0许可证。