speech-recognition-local本地语音转录

本地语音转文字 / Local Speech-to-Text. 使用 faster-whisper 在本地运行 Whisper 模型，无需 API 费用，完全免费。收到语音消息(.ogg .m4a .mp3)自动触发转录，支持中文/英文/日语/自动检测。| Free local STT/TTS alternative — runs Whisper on your machine, no API costs, auto-transcribes voice messages in seconds.

作者: admin | 来源: ClawHub

本地语音识别 / Local Speech Recognition

使用 faster-whisper 在本地运行 Whisper 模型，无需任何 API 费用。免费、离线、保护隐私。
Runs faster-whisper locally — no API keys, no costs, fully offline & private.

功能特点 / Features

- 🎙️ 全自动转录 — 收到语音消息自动触发，无需手动调用
💰 完全免费 — 无需 API key，无任何费用
🔒 隐私安全 — 所有处理在本地完成，音频不离开你的设备
🌐 多语言支持 — 中文 / 英文 / 日语 / 自动检测
⚡ 快速响应 — VAD 静音过滤，模型内存缓存
📦 主流格式 — .ogg .m4a .mp3 .wav

使用方式 / Usage

收到语音消息后，OpenClaw 自动调用转录脚本并将结果注入对话。

转录命令 / Command:
CODEBLOCK0

参数说明 / Parameters:

参数	默认值	说明
INLINECODE0	—	音频文件路径 / Audio file path
INLINECODE1

auto | 语言：zh / en / ja / auto（默认自动检测） |

模型说明 / Model Info

- 默认模型 / Default: base（精度与速度平衡）
首次使用自动下载 / Auto-download on first use
VAD 静音过滤已启用 / VAD filtering enabled
模型缓存在内存中 / Model cached in memory

适用场景 / Use Cases

场景 / Scenario	说明
语音消息转文字	将微信/飞书/Telegram 语音转为可阅读文本
会议记录

限制 / Limitations

- 支持格式 / Supported: .ogg .m4a .mp3 INLINECODE7
文件大小 / Max size: 25MB

安装前提 / Requirements

- Python 3.8+
faster-whisper（首次使用自动安装）

本地语音识别 / Local Speech Recognition

使用 faster-whisper 在本地运行 Whisper 模型，无需任何 API 费用。免费、离线、保护隐私。
Runs faster-whisper locally — no API keys, no costs, fully offline & private.

功能特点 / Features

- 🎙️ 全自动转录 — 收到语音消息自动触发，无需手动调用
💰 完全免费 — 无需 API key，无任何费用
🔒 隐私安全 — 所有处理在本地完成，音频不离开你的设备
🌐 多语言支持 — 中文 / 英文 / 日语 / 自动检测
⚡ 快速响应 — VAD 静音过滤，模型内存缓存
📦 主流格式 — .ogg .m4a .mp3 .wav

使用方式 / Usage

收到语音消息后，OpenClaw 自动调用转录脚本并将结果注入对话。

转录命令 / Command:
bash
python3 ~/.openclaw/workspace/skills/speech-recognition-local/scripts/transcribe.py [language]

参数说明 / Parameters:

参数	默认值	说明
audio_file	—	音频文件路径 / Audio file path
language

auto | 语言：zh / en / ja / auto（默认自动检测） |

模型说明 / Model Info

- 默认模型 / Default: base（精度与速度平衡）
首次使用自动下载 / Auto-download on first use
VAD 静音过滤已启用 / VAD filtering enabled
模型缓存在内存中 / Model cached in memory

适用场景 / Use Cases

场景 / Scenario	说明
语音消息转文字	将微信/飞书/Telegram 语音转为可阅读文本
会议记录

限制 / Limitations

- 支持格式 / Supported: .ogg .m4a .mp3 .wav
文件大小 / Max size: 25MB

安装前提 / Requirements

- Python 3.8+
faster-whisper（首次使用自动安装）

speech-recognition-local本地语音转录

speech-recognition-local

本地语音识别 / Local Speech Recognition

功能特点 / Features

使用方式 / Usage

模型说明 / Model Info

适用场景 / Use Cases

限制 / Limitations

安装前提 / Requirements

本地语音识别 / Local Speech Recognition

功能特点 / Features

使用方式 / Usage

模型说明 / Model Info

适用场景 / Use Cases

限制 / Limitations

安装前提 / Requirements

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

speech-recognition-local本地语音转录

speech-recognition-local

本地语音识别 / Local Speech Recognition

功能特点 / Features

使用方式 / Usage

模型说明 / Model Info

适用场景 / Use Cases

限制 / Limitations

安装前提 / Requirements

本地语音识别 / Local Speech Recognition

功能特点 / Features

使用方式 / Usage

模型说明 / Model Info

适用场景 / Use Cases

限制 / Limitations

安装前提 / Requirements

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement