senseaudio-voice

SenseAudio Voice - 语音合成 (TTS) + 语音识别 (ASR)，完整语音交互能力

基于 SenseAudio HTTP API + Edge TTS 实现，根据语言自动选择最佳方案。

✨ 特点

🎤 完整语音能力

- TTS 语音合成 - 文字转语音，支持多声音
ASR 语音识别 - 语音转文字，高精度识别
HTTP 接口 - 简单可靠，无需复杂依赖
语言自动检测 - 中文用 SenseAudio，英语/日语用 Edge TTS

🌍 语言支持策略
语言 TTS 方案 ASR 方案说明
中文 SenseAudio SenseAudio 需要大陆手机号 + 身份认证，免费使用
英语
Edge TTS | SenseAudio | 海外友好，无需认证 |

语言	TTS 方案	ASR 方案	说明
中文	SenseAudio	SenseAudio	需要大陆手机号 + 身份认证，免费使用
英语

🔧 技术优势

- 简单依赖 - 只需要 requests 库
WAV 格式 - 系统兼容性好，无需额外解码器
智能播放 - 自动检测设备支持的播放器
异常处理 - 完整的错误处理和降级方案

🚀 快速使用

CODEBLOCK0

📁 文件存储

音频文件保存位置: INLINECODE1

CODEBLOCK1

- 默认按日期分类存储
文件名格式：INLINECODE2
使用 -o 参数可指定自定义路径

🎤 可用语音

SenseAudio 声音（中文）
声音 ID 性别描述
INLINECODE4 童声 ✅ 默认，亲切活泼，适合学习场景
INLINECODE5
男 | 温暖男声 |

声音 ID	性别	描述
INLINECODE4	童声	✅ 默认，亲切活泼，适合学习场景
INLINECODE5

Edge TTS 声音（英语/日语）
语言声音代码描述
英语 (en-US) INLINECODE9 女声，清晰友好（默认）
`en-US-GuyNeural` | 男声，温暖专业 |

语言	声音代码	描述
英语 (en-US)	INLINECODE9	女声，清晰友好（默认）

📋 选项

选项	说明	默认值
INLINECODE14	语音 ID	child0001a (中文) / en-US-JennyNeural (英语) / ja-JP-NanamiNeural (日语)
INLINECODE15

输出文件 | audio/YYYY-MM-DD/*.wav | | --play, -p | 生成后自动播放 | true | | --format | 音频格式 (wav/mp3) | wav | | --speed | 语速 (0.5-2.0) | 1.0 | | --volume | 音量 (0-10) | 1.0 | | --engine, -e | 引擎 (senseaudio/edge/auto) | auto (自动检测) | | --lang, -l | 语言 (zh/en/ja/auto) | auto (自动检测) |

🔧 配置

SenseAudio API Key: 从 ~/.openclaw/openclaw.json 的 env.SENSE_API_KEY 读取

Edge TTS: 无需 API Key，直接调用 Microsoft Edge 服务

⚙️ 使用建议

- 中国大陆用户：配置 SENSE_API_KEY，中文使用 SenseAudio（免费，需手机号 + 身份认证）
海外用户：无需配置，自动使用 Edge TTS（英语/日语支持好）
混合场景：保持 auto 模式，根据语言自动选择最佳方案

📝 使用示例

中文场景（使用 SenseAudio）

CODEBLOCK2

英语场景（自动使用 Edge TTS）

CODEBLOCK3

日语场景（自动使用 Edge TTS）

CODEBLOCK4

语言检测

CODEBLOCK5

🔌 API 接口

SenseAudio（中文）

- 端点: INLINECODE26
鉴权: INLINECODE27
文档: https://senseaudio.cn/docs/texttospeech_api
限制: 需要大陆手机号 + 身份认证，免费使用

Edge TTS（英语/日语）

- 端点: Microsoft Edge TTS Service
鉴权: 无需 API Key
依赖: edge-tts Python 库（可选）或直接 HTTP 调用
限制: 无地区限制，海外友好

⚠️ 注意事项

SenseAudio（中文）

- 需要联网（调用 SenseAudio 服务）
依赖 SENSE_API_KEY 环境变量或配置文件
仅限中国大陆地区：需要手机号 + 身份认证才能免费使用
单次请求最大文本长度：10000 字符

Edge TTS（英语/日语）

- 需要联网（调用 Microsoft Edge 服务）
无需 API Key，无地区限制
海外用户推荐使用

通用

- 音频播放器：自动检测，推荐安装 aplay (ALSA) 或 paplay (PulseAudio)
语言检测逻辑：

- 包含中文字符 → SenseAudio - 包含日文字符（假名/汉字）→ Edge TTS - 纯拉丁字母 → Edge TTS - 混合语言 → 按主要字符类型判断

🔧 播放器检测

CODEBLOCK6

输出示例:
CODEBLOCK7

播放流程:

1. 验证文件存在性和完整性
检测系统可用的播放器
按优先级尝试播放
失败时自动降级到下一个播放器
所有播放器失败时给出详细错误日志和建议

senseaudio-voice

SenseAudio Voice - 语音合成 (TTS) + 语音识别 (ASR)，完整语音交互能力

基于 SenseAudio HTTP API + Edge TTS 实现，根据语言自动选择最佳方案。

✨ 特点

🎤 完整语音能力

- TTS 语音合成 - 文字转语音，支持多声音
ASR 语音识别 - 语音转文字，高精度识别
HTTP 接口 - 简单可靠，无需复杂依赖
语言自动检测 - 中文用 SenseAudio，英语/日语用 Edge TTS

🌍 语言支持策略
语言 TTS 方案 ASR 方案说明
中文 SenseAudio SenseAudio 需要大陆手机号 + 身份认证，免费使用
英语
Edge TTS | SenseAudio | 海外友好，无需认证 |

语言	TTS 方案	ASR 方案	说明
中文	SenseAudio	SenseAudio	需要大陆手机号 + 身份认证，免费使用
英语

🔧 技术优势

- 简单依赖 - 只需要 requests 库
WAV 格式 - 系统兼容性好，无需额外解码器
智能播放 - 自动检测设备支持的播放器
异常处理 - 完整的错误处理和降级方案

🚀 快速使用

bash

基础用法（自动检测语言）

python {baseDir}/scripts/tts.py 你好，这是语音测试
python {baseDir}/scripts/tts.py Hello, this is a test
python {baseDir}/scripts/tts.py こんにちは、テストです

指定声音（仅 SenseAudio）

python {baseDir}/scripts/tts.py --voice male0004a 你好呀

指定输出文件

python {baseDir}/scripts/tts.py -o output.wav 语音内容

生成并播放

python {baseDir}/scripts/tts.py --play 宝贝，该写作业啦

强制使用 Edge TTS（英语/日语推荐）

python {baseDir}/scripts/tts.py --engine edge Hello, how are you?

强制使用 SenseAudio（仅中文）

python {baseDir}/scripts/tts.py --engine senseaudio 你好，今天天气不错

检查系统播放器

python {baseDir}/scripts/tts.py --check-players

📁 文件存储

音频文件保存位置: {workspace}/audio/YYYY-MM-DD/

/home/wang/.openclaw/agents/kids-study/workspace/audio/
└── 2026-03-14/
├── 095221male0004a测试完成，文件应该在.mp3
└── 095158male0004a你好，音频文件现在保.mp3

- 默认按日期分类存储
文件名格式：HHMMSSvoice文本前缀.mp3
使用 -o 参数可指定自定义路径

🎤 可用语音

SenseAudio 声音（中文）
声音 ID 性别描述
child0001a 童声 ✅ 默认，亲切活泼，适合学习场景
male0004a
男 | 温暖男声 |

声音 ID	性别	描述
child0001a	童声	✅ 默认，亲切活泼，适合学习场景
male0004a

Edge TTS 声音（英语/日语）
语言声音代码描述
英语 (en-US) en-US-JennyNeural 女声，清晰友好（默认）
en-US-GuyNeural | 男声，温暖专业 |

语言	声音代码	描述
英语 (en-US)	en-US-JennyNeural	女声，清晰友好（默认）

📋 选项

选项	说明	默认值
--voice, -v	语音 ID	child0001a (中文) / en-US-JennyNeural (英语) / ja-JP-NanamiNeural (日语)
--output, -o

输出文件 | audio/YYYY-MM-DD/*.wav | | --play, -p | 生成后自动播放 | true | | --format | 音频格式 (wav/mp3) | wav | | --speed | 语速 (0.5-2.0) | 1.0 | | --volume | 音量 (0-10) | 1.0 | | --engine, -e | 引擎 (senseaudio/edge/auto) | auto (自动检测) | | --lang, -l | 语言 (zh/en/ja/auto) | auto (自动检测) |

🔧 配置

SenseAudio API Key: 从 ~/.openclaw/openclaw.json 的 env.SENSEAPIKEY 读取

Edge TTS: 无需 API Key，直接调用 Microsoft Edge 服务

⚙️ 使用建议

- 中国大陆用户：配置 SENSEAPIKEY，中文使用 SenseAudio（免费，需手机号 + 身份认证）
海外用户：无需配置，自动使用 Edge TTS（英语/日语支持好）
混合场景：保持 auto 模式，根据语言自动选择最佳方案

📝 使用示例

中文场景（使用 SenseAudio）

bash

默认童声（适合学习场景）

python {baseDir}/scripts/tts.py --play 宝贝，该写作业啦

日常问候

python {baseDir}/scripts/tts.py --play 早上好呀，今天天气不错

切换声音（男声）

python {baseDir}/scripts/tts.py --voice male0004a --play 该去上班啦

调节语速

python {baseDir}/scripts/tts.py --speed 1.2 --play 这是快一点的语音 python {baseDir}/scripts/tts.py --speed 0.8 --play 这是慢一点的语音

英语场景（自动使用 Edge TTS）

bash

英语问候（自动检测，使用 Edge TTS）

python {baseDir}/scripts/tts.py --play Hello! How are you today?

强制使用 Edge TTS

python {baseDir}/scripts/tts.py --engine edge --play Good morning, everyone!

使用男声

python {baseDir}/scripts/tts.py --voice en-US-GuyNeural --play Lets start learning!

日语场景（自动使用 Edge TTS）

bash

日语问候（自动检测，使用 Edge TTS）

python {baseDir}/scripts/tts.py --play こんにちは、お元気ですか？

使用男声

python {baseDir}/scripts/tts.py --voice ja-JP-KeitaNeural --play 一緒に勉強しましょう！

语言检测

bash

自动检测语言并选择合适的引擎

python {baseDir}/scripts/tts.py --lang auto --play Hello 你好こんにちは

🔌 API 接口

SenseAudio（中文）

- 端点: POST https://api.senseaudio.cn/v1/t2av2
鉴权: Authorization: Bearer KEY>
文档: https://senseaudio.cn/docs/texttospeech_api
限制: 需要大陆手机号 + 身份认证，免费使用

Edge TTS（英语/日语）

- 端点: Microsoft Edge TTS Service
鉴权: 无需 API Key
依赖: edge-tts Python 库（可选）或直接 HTTP 调用
限制: 无地区限制，海外友好

⚠️ 注意事项

SenseAudio（中文）

- 需要联网（调用 SenseAudio 服务）
依赖 SENSEAPIKEY 环境变量或配置文件
仅限中国大陆地区：需要手机号 + 身份认证才能免费使用
单次请求最大文本长度：10000 字符

Edge TTS（英语/日语）

- 需要联网（调用 Microsoft Edge 服务）
无需 API Key，无地区限制
海外用户推荐使用

通用

- 音频播放器：自动检测，

senseaudio-voice语音合成识别