Xiaomi MiMo Voice — 语音合成技能

通过小米 MiMo V2 TTS API 将文字转为自然流畅的语音。

前置条件

1. 安装依赖

CODEBLOCK0

2. 配置 API Key

编辑 ~/.openclaw/openclaw.json，在 skills.entries 下添加：

CODEBLOCK1

💡 也可以使用环境变量 export MIMO_API_KEY=xxx，但推荐用 Skill 级别配置，更整洁且仅对该 Skill 生效。

使用方式

CODEBLOCK2

参数

参数	说明	默认值
INLINECODE3	要合成的文字（必填，可含风格标签）	—
INLINECODE4

音色

音色	说明
INLINECODE14	默认音色
INLINECODE15

中文优化 | | default_en | 英文优化 |

风格列表

类别	风格
情感	INLINECODE17 · `Sad` · `Angry` · `Surprised` · `Fearful` · `Disgusted` · INLINECODE23
语速

Speed up · Slow down | | 角色 | Sun Wukong · Lin Daiyu · Zhang Fei · Guan Yu · Zhuge Liang | | 风格 | Whisper · Clamped voice · Taiwanese accent | | 方言 | Northeastern dialect · Sichuan dialect · Cantonese · Henan dialect | | 其他 | 唱歌 · Narration · Storytelling |

示例

CODEBLOCK3

输出格式

CODEBLOCK4

故障排除

问题	原因	解决方案
INLINECODE41	未配置 API Key	在 `skills.entries.xiaomi-mimo-voice.env` 中配置
INLINECODE43

技术细节

- 模型：INLINECODE48
API：INLINECODE49
采样率：24kHz（PCM16 格式）
风格标签格式：<style>风格</style> 放在文字开头

更新日志

v1.0.2 (2026-03-24)

- 配置方式统一为 Skill 级别 env（openclaw.json skills.entries）
修复依赖说明（openai → requests）
文档结构优化

v1.0.1 (2026-03-24)

- 移除 openclaw.json tools 自定义键配置
API Key 改为环境变量读取

v1.0.0 (2026-03-24)

- 首次发布：中文/英文语音合成，支持情感/角色/方言等多种风格

Xiaomi MiMo Voice — 语音合成技能

通过小米 MiMo V2 TTS API 将文字转为自然流畅的语音。

前置条件

1. 安装依赖

bash
pip install requests

2. 配置 API Key

编辑 ~/.openclaw/openclaw.json，在 skills.entries 下添加：

json
{
skills: {
entries: {
xiaomi-mimo-voice: {
enabled: true,
env: {
MIMOAPIKEY: your-api-key
}
}
}
}
}

💡 也可以使用环境变量 export MIMOAPIKEY=xxx，但推荐用 Skill 级别配置，更整洁且仅对该 Skill 生效。

使用方式

bash
python3 /scripts/tts.py --text 要合成的文字 --output audio.wav

参数

参数	说明	默认值
--text	要合成的文字（必填，可含风格标签）	—
--output

音色

音色	说明
mimodefault	默认音色
defaultzh

中文优化 | | default_en | 英文优化 |

风格列表

类别	风格
情感	Happy · Sad · Angry · Surprised · Fearful · Disgusted · Calm
语速

Speed up · Slow down | | 角色 | Sun Wukong · Lin Daiyu · Zhang Fei · Guan Yu · Zhuge Liang | | 风格 | Whisper · Clamped voice · Taiwanese accent | | 方言 | Northeastern dialect · Sichuan dialect · Cantonese · Henan dialect | | 其他 | 唱歌 · Narration · Storytelling |

示例

bash

基础合成

python3 scripts/tts.py --text 你好，世界！ --output hello.wav

情感风格

python3 scripts/tts.py --text 太开心了！ --style Happy --output happy.wav

角色扮演

python3 scripts/tts.py --text 俺老孙来也！ --style Sun Wukong --output wukong.wav

英文

python3 scripts/tts.py --text Hello world! --voice defaulten --output helloen.wav

方言

python3 scripts/tts.py --text 干啥呢老铁 --style Northeastern dialect --output dongbei.wav

播报

python3 scripts/tts.py --text 以下是今天的新闻摘要 --style Narration --output news.wav