返回顶部
p

pronunciation-coach发音教练

Pronunciation coaching with real voice analysis using Azure Speech Services. Analyzes audio files for phoneme-level accuracy, fluency, prosody, and intonation scores.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.4
安全检测
已通过
580
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pronunciation-coach

发音教练

使用 Azure 语音服务分析英语口语发音,并提供可操作的辅导反馈。

隐私说明:此技能从 ~/.openclaw/media/inbound/ 读取本地语音消息,并将其传输至 Microsoft Azure 语音服务进行处理。

前置条件

  • - Azure 语音 API 密钥:设置 AZURESPEECHKEY 环境变量
  • Azure 语音区域:设置 AZURESPEECHREGION 环境变量(例如 southeastasia)
  • ffmpeg:音频格式转换所需(必须在 PATH 中)
  • Node.js:报告生成所需

工作流程

1. 接收音频

来自 Telegram 的语音消息存储在 ~/.openclaw/media/inbound/ 中。查找与消息时间戳匹配的最新 .ogg 文件。

bash
ls -lt ~/.openclaw/media/inbound/*.ogg | head -5

2. 运行评估

bash
scripts/pronunciation-assess.sh <音频文件> <参考文本>

  • - 音频文件:语音消息的路径(ogg/wav/mp3/m4a)
  • 参考文本:说话者意图表达的内容(来自转录文本)
  • 脚本会自动将任何格式转换为 16kHz 单声道 WAV

3. 生成报告

将 JSON 输出通过管道传递给报告生成器:

bash
scripts/pronunciation-assess.sh audio.ogg 参考文本 | node scripts/pronunciation-report.js

报告包含:

  • - 总体评分(发音、准确度、流利度、韵律、完整性)
  • 逐词分解及每个音素的评分
  • 问题发音高亮显示
  • 结论及可操作的下步建议

4. 提供辅导

生成报告后:

  1. 1. 向用户发送文本报告(评分 + 单词分解)
  2. 从音素评分中识别出前 3 个问题发音
  3. 解释每个问题——正确发音是什么以及如何发出该音
- 音素描述和修正方法请参阅 references/phoneme-guide.md
  1. 4. 发送语音消息(通过 TTS)演示问题单词的正确发音
  2. 布置练习——给用户指定具体句子,要求其重新录制,重点练习薄弱发音

辅导技巧

  • - 评分 ≥ 90:优秀,只需微调
  • 评分 70-89:良好,需要针对性练习
  • 评分 < 70:需要对该特定发音进行集中训练
  • 遗漏错误表示未检测到该单词——说话者可能声音太小或含糊不清
  • 韵律评分 < 85 表明语调平淡——辅导时注意语调的升降变化
  • 比较多次录音的评分以追踪进步情况

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pronunciation-coach-1776077544 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pronunciation-coach-1776077544 技能

通过命令行安装

skillhub install pronunciation-coach-1776077544

下载

⬇ 下载 pronunciation-coach v1.0.4(免费)

文件大小: 6.98 KB | 发布时间: 2026-4-15 14:01

v1.0.4 最新 2026-4-15 14:01
- Removed support for passing Azure Speech API key and region directly via command line; now requires environment variables.
- Updated SKILL.md to reflect simplified usage and prerequisite instructions.
- scripts/pronunciation-assess.sh no longer accepts key/region as optional arguments.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部