返回顶部
p

pdf-vocab-audioPDF词汇音频

从 PDF 提取词汇生成朗读音频,每个词组读两遍

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.0.0
安全检测
已通过
128
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pdf-vocab-audio

PDF 词汇音频生成器

从 PDF 词汇表提取英文单词,生成朗读音频。

作者

Maosi 英语团队

使用方法

bash

指定PDF文件


python3 pdfvocabaudio.py /path/to/vocabulary.pdf

使用最新PDF(inbound目录)

python3 pdfvocabaudio.py

输入格式

PDF 文件中每行包含:

  • - 英文单词/词组 + 中文翻译
  • 示例:tiger 老虎、computer game 电脑游戏

处理规则

  1. 1. 提取英文 - 每行只提取英文部分
  2. 保留词组 - 多个单词的词组保持完整
  3. 每个读两遍 - 词组读两遍,中间停1秒
  4. 语速 - -20%,英式男声 (en-GB-RyanNeural)

音频格式

  • - 语音:en-GB-RyanNeural
  • 语速:-20%
  • 停顿:1秒

输出

  • - 保存到:/tmp/
  • 命名:{原文件名} 词汇朗读音频.mp3

示例

输入PDF内容:

tiger 老虎
message 消息
computer game 电脑游戏

输出音频:

  • - tiger (第1遍) → 停1秒 → tiger (第2遍) → 停1秒
  • message (第1遍) → 停1秒 → message (第2遍) → 停1秒
  • computer game (第1遍) → 停1秒 → computer game (第2遍)

技术实现

  1. 1. PDF解析:使用 PyMuPDF 提取文本
  2. 依赖检查:使用 shutil.which() 验证工具存在
  3. 英文过滤:正则匹配,只保留英文字母和空格
  4. 音频生成:edge-tts 生成单词/词组音频
  5. 静音生成:ffmpeg 生成1秒静音片段
  6. 音频合并:ffmpeg concat 合并所有片段

安全设计

  • - ✅ 依赖验证:启动时检查 edge-tts 和 ffmpeg 是否可用
  • 输入验证:PDF文件存在性和格式检查
  • 路径隔离:所有操作在临时目录完成
  • 临时目录:使用系统临时目录,自动清理
  • subprocess安全:使用 shutil.which() 验证工具路径,参数列表传递
  • 超时保护:30秒超时防止进程挂起
  • 资源清理:临时文件自动清理

许可证

Apache License 2.0

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pdf-vocab-audio-1776027615 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pdf-vocab-audio-1776027615 技能

通过命令行安装

skillhub install pdf-vocab-audio-1776027615

下载

⬇ 下载 pdf-vocab-audio v2.0.0(免费)

文件大小: 4.39 KB | 发布时间: 2026-4-13 11:26

v2.0.0 最新 2026-4-13 11:26
v2.0

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部