返回顶部
f

feishu-voice-loop飞书语音循环

A reusable Feishu voice loop: accept text or voice input, generate natural OpenAI speech, and deliver it to chat or web playback. Use when building or sharing a reusable Feishu voice workflow with text-or-voice in and audio out, including browser playback and Feishu voice replies.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
315
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

feishu-voice-loop

Feishu 语音循环

为 OpenClaw 提供可复用的三步语音循环:

  1. 1. 接收文本或语音输入
  2. 使用 OpenAI TTS 生成语音
  3. 将音频返回给 飞书网页播放器

当输入为语音时,先将其转录为文本,然后继续通过相同的输出管道。

快速开始

前置条件:

  • - 已设置 OPENAIAPIKEY 用于 TTS
  • 飞书应用凭证存在于 ~/.openclaw/openclaw.json 的 channels.feishu.appId/appSecret 下,或显式传入
  • 已安装 ffmpeg 和 ffprobe 并可用
  • 本地音频转录已在 ~/.openclaw/openclaw.json 的 tools.media.audio.models 下配置

主要脚本:

  • - scripts/openaittsfeishu.py
  • scripts/transcribe_audio.py

任务

1. 转录语音输入

当你有本地的 .ogg、.opus、.wav 或类似文件并需要文本时使用。

bash
python3 scripts/transcribe_audio.py /path/to/input.ogg

此脚本复用 ~/.openclaw/openclaw.json 中现有的 Whisper CLI 配置。

2. 生成并发送语音输出

当你已有文本并希望发送飞书语音消息时使用。

bash
python3 scripts/openaittsfeishu.py \
--to openid> \
--text 这条是语音测试。 \
--voice alloy \
--model gpt-4o-mini-tts

该脚本将:

  1. 1. 调用 OpenAI audio/speech
  2. 临时保存 WAV 音频
  3. 通过 ffmpeg 转换为飞书友好的 Opus 格式
  4. 将文件上传到飞书
  5. 向目标 open_id 发送 audio 消息

3. 运行完整语音循环

当目标是可复用的语音交互管道时使用此技能:

  1. 1. 将输入音频转录为文本
  2. 决定或生成回复文本
  3. 使用 OpenAI TTS 合成回复音频
  4. 将回复发送回飞书

在构建或解释端到端循环时,请阅读 references/input-output-workflow.md。

默认输出风格

默认预设存储在 references/presets.md 中。

除非用户另有要求,否则使用:

  • - 模型:gpt-4o-mini-tts
  • 音色:alloy
  • 默认风格:年轻日系男声感、温柔里带一点撩、贴耳边私聊感、自然、不播音腔

当用户要求不同风格时,可以:

  • - 传入自定义 --instructions
  • 或调整 references/presets.md 中的某个预设

处理故障

常见故障情况:

  • - 缺少 OPENAIAPIKEY → 请求提供 API 密钥/环境设置
  • OpenAI 返回 HTTP 429 → 计费或配额问题
  • 缺少飞书应用凭证 → 配置 channels.feishu.appId/appSecret
  • 缺少 ffmpeg 或 ffprobe → 在重试前本地安装
  • 缺少转录模型配置 → 配置 tools.media.audio.models

当 OpenAI 计费未启用时,直接说明,而不是假装生成了语音。

打包与分享

使用以下命令打包:

bash
python3 /Users/zoepeng/.openclaw/lib/nodemodules/openclaw/skills/skill-creator/scripts/packageskill.py \
/Users/zoepeng/.openclaw/workspace/skills/openai-feishu-voice

生成的 .skill 文件可以分享或上传到用户分发技能的任何地方。

资源

scripts/openaittsfeishu.py

用于确定性的 TTS 生成和飞书投递。

scripts/transcribe_audio.py

用于通过配置的 Whisper CLI 进行确定性的本地音频转录。

references/presets.md

当用户要求不同的语音方向或想要命名预设时阅读。

references/input-output-workflow.md

在打包或解释完整的语音输入/语音输出解决方案时阅读。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 feishu-voice-loop-1776125828 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 feishu-voice-loop-1776125828 技能

通过命令行安装

skillhub install feishu-voice-loop-1776125828

下载

⬇ 下载 feishu-voice-loop v1.0.0(免费)

文件大小: 7.87 KB | 发布时间: 2026-4-15 12:43

v1.0.0 最新 2026-4-15 12:43
Initial public release of Feishu Voice Loop.
Supports text or voice input, local transcription, OpenAI TTS speech generation, and Feishu audio delivery.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部