q_code

扫码关注官方微信

cell_code

扫码下载APP

返回顶部

p

pdf-vocab-audioPDF词汇音频

从 PDF 提取词汇生成朗读音频，每个词组读两遍

作者: admin | 来源: ClawHub

下载

源自

ClawHub

版本

V 2.0.0

安全检测

已通过

128
下载量

免费
免费

0
收藏

概述

安装方式

版本历史

pdf-vocab-audio

PDF 词汇音频生成器

从 PDF 词汇表提取英文单词，生成朗读音频。

作者

Maosi 英语团队

使用方法

bash

指定PDF文件

python3 pdfvocabaudio.py /path/to/vocabulary.pdf

使用最新PDF（inbound目录）

python3 pdfvocabaudio.py

输入格式

PDF 文件中每行包含：

- 英文单词/词组 + 中文翻译
示例：tiger 老虎、computer game 电脑游戏

处理规则

1. 提取英文 - 每行只提取英文部分
保留词组 - 多个单词的词组保持完整
每个读两遍 - 词组读两遍，中间停1秒
语速 - -20%，英式男声 (en-GB-RyanNeural)

音频格式

- 语音：en-GB-RyanNeural
语速：-20%
停顿：1秒

输出

- 保存到：/tmp/
命名：{原文件名} 词汇朗读音频.mp3

示例

输入PDF内容：

tiger 老虎
message 消息
computer game 电脑游戏

输出音频：

- tiger (第1遍) → 停1秒 → tiger (第2遍) → 停1秒
message (第1遍) → 停1秒 → message (第2遍) → 停1秒
computer game (第1遍) → 停1秒 → computer game (第2遍)

技术实现

1. PDF解析：使用 PyMuPDF 提取文本
依赖检查：使用 shutil.which() 验证工具存在
英文过滤：正则匹配，只保留英文字母和空格
音频生成：edge-tts 生成单词/词组音频
静音生成：ffmpeg 生成1秒静音片段
音频合并：ffmpeg concat 合并所有片段

安全设计

- ✅ 依赖验证：启动时检查 edge-tts 和 ffmpeg 是否可用
✅ 输入验证：PDF文件存在性和格式检查
✅ 路径隔离：所有操作在临时目录完成
✅ 临时目录：使用系统临时目录，自动清理
✅ subprocess安全：使用 shutil.which() 验证工具路径，参数列表传递
✅ 超时保护：30秒超时防止进程挂起
✅ 资源清理：临时文件自动清理

许可证

Apache License 2.0

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装：

OpenClaw WorkBuddy QClaw Kimi Claude

方式一：安装 SkillHub 和技能

帮我安装 SkillHub 和 pdf-vocab-audio-1776027615 技能

方式二：设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源，然后帮我安装 pdf-vocab-audio-1776027615 技能

通过命令行安装

skillhub install pdf-vocab-audio-1776027615

下载

⬇ 下载 pdf-vocab-audio v2.0.0（免费）

文件大小: 4.39 KB | 发布时间: 2026-4-13 11:26

v2.0.0 最新 2026-4-13 11:26

v2.0

闲社论坛
关于我们会员介绍开通会员羊毛论坛
闲社论坛
羊毛交流论坛线报讨论社区优惠分享交流线报更新服务
网站服务
会员咨询：515151560 广告合作：515151570 投诉建议：515151580 售后指导：515151590

多链集团旗下-闲社网

闲社网热线

免费联系电话

0527-80111111

服务时间：周一到周日 8:00-24:00

公众号
闲社闲社线报社区

关注闲社网

闲社在线客服
关注闲社网微信
闲社网APP

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0 © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large

返回顶部