Groq Voice Transcribe
Fast speech-to-text for voice notes and audio files through Groq's OpenAI-compatible transcription endpoint.
Use it when you want cloud transcription via Groq instead of running Whisper locally.
Best for:
- - Telegram / Signal voice notes
- short audio clips
- Chinese, English, or mixed daily speech
- fast transcript generation for follow-up summarization or chat replies
What you need
You need a Groq API key.
Groq often provides a free developer tier / trial credits for new users.
Get one from:
- - https://console.groq.com/
- Sign in, open API Keys, then create a key
Easiest setup in OpenClaw
If OpenClaw is already running and configured, you can simply ask your assistant:
- - "Configure Groq Voice Transcribe for me"
- "Here is my Groq API key, set up Groq Voice Transcribe"
The assistant can place the key into ~/.openclaw/openclaw.json for you.
Manual setup
Set GROQ_API_KEY, or configure it in ~/.openclaw/openclaw.json under:
CODEBLOCK0
Quick start
CODEBLOCK1
Defaults:
- - Model: INLINECODE3
- Output: INLINECODE4
- Format: plain text
Common examples
CODEBLOCK2
Flags
- -
--model <name>: transcription model (default whisper-large-v3-turbo) - INLINECODE7 : output file path
- INLINECODE8 : hint the spoken language, for example
zh, en, INLINECODE11 - INLINECODE12 : optional context or spelling hint
- INLINECODE13 : write verbose JSON instead of plain text
Notes
- - Audio is sent to Groq for transcription.
- This skill is meant for transcription, not text-to-speech.
- If language is omitted, Groq can usually auto-detect it, but passing
--language zh often helps for Chinese voice notes.
Groq 语音转录
通过 Groq 兼容 OpenAI 的转录端点,快速将语音笔记和音频文件转换为文字。
当你希望通过 Groq 进行云端转录而非本地运行 Whisper 时使用。
最佳适用场景:
- - Telegram / Signal 语音消息
- 短音频片段
- 中文、英文或中英混合的日常对话
- 为后续摘要或聊天回复快速生成转录文本
准备工作
你需要一个 Groq API 密钥。
Groq 通常为新用户提供免费开发者层级或试用积分。
获取方式:
- - 访问 https://console.groq.com/
- 登录后,打开 API Keys,然后创建一个密钥
OpenClaw 中最简单的配置方式
如果 OpenClaw 已运行并配置完成,你可以直接让助手执行:
- - 帮我配置 Groq 语音转录
- 这是我的 Groq API 密钥,请设置 Groq 语音转录
助手会将密钥自动填入 ~/.openclaw/openclaw.json 文件中。
手动配置
设置 GROQAPIKEY 环境变量,或在 ~/.openclaw/openclaw.json 中按以下格式配置:
json
{
skills: {
entries: {
groq-voice-transcribe: {
apiKey: 在此处填入 GROQ 密钥
}
}
}
}
快速开始
bash
{baseDir}/scripts/transcribe.sh /path/to/audio.ogg
默认参数:
- - 模型:whisper-large-v3-turbo
- 输出:<输入文件名>.txt
- 格式:纯文本
常见示例
bash
基础转录
{baseDir}/scripts/transcribe.sh /path/to/audio.ogg
中文语音消息
{baseDir}/scripts/transcribe.sh /path/to/audio.ogg --language zh --prompt 中文普通话,日常聊天
保存到自定义文件
{baseDir}/scripts/transcribe.sh /path/to/audio.ogg --out /tmp/transcript.txt
详细 JSON 输出
{baseDir}/scripts/transcribe.sh /path/to/audio.ogg --json --out /tmp/transcript.json
参数说明
- - --model <名称>:转录模型(默认 whisper-large-v3-turbo)
- --out <路径>:输出文件路径
- --language <代码>:提示口语语言,例如 zh、en、ja
- --prompt <文本>:可选的上下文或拼写提示
- --json:输出详细 JSON 格式而非纯文本
注意事项
- - 音频将被发送至 Groq 进行转录。
- 此技能仅用于语音转文字,不支持文字转语音。
- 如果省略语言参数,Groq 通常能自动检测,但对于中文语音消息,建议添加 --language zh 参数以提高准确率。