返回顶部
d

digital-avatar数字人生成

数字人/虚拟形象生成和口播视频制作。支持多个后端:可灵 Kling、即梦 Jimeng、HeyGen、D-ID、Synthesia。输入形象描述或真人照片,输出数字人资源ID或口播视频片段。触发词:数字人、虚拟人、AI主播、avatar、口播视频、talking head。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
127
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

digital-avatar

数字人生成

功能

  1. 1. 创建数字人形象:从描述或照片生成数字人
  2. 声纹克隆(可选):上传音频样本 → 克隆声纹
  3. 生成口播视频:数字人 + 台词/音频 → 口播视频片段

语音来源选项

方式说明推荐场景
平台内置 TTS用平台预设声音快速测试
上传音频
提供录好的音频文件 | 有现成配音 | | 平台声纹克隆 | 上传样本 → 平台克隆 | 推荐,全链路统一 | | 外部 TTS | 用 MiniMax 等生成后上传 | 平台不支持克隆时 |

推荐:优先用平台自带的声纹克隆,保持后端一致性。

⚠️ 重要:后端一致性原则

同一个数字人项目必须全程使用同一个后端!

  • - 可灵的 avatar_id 和即梦的不互通
  • 即梦创建的形象,可灵用不了,反之亦然
  • 选定后端后,从创建形象到生成口播都用同一个

支持的后端

后端数字人口播声纹克隆特点
Kling 可灵质量高,国产首选
Jimeng 即梦
✓ | ✓ | ✓ | 快,中文口型好,剪映生态 | | HeyGen | ✓ | ✓ | ✓ | 模板丰富,出海/英文 | | D-ID | ✓ | ✓ | - | 简单快速 | | Synthesia | ✓ | ✓ | ✓ | 企业级,多语言 |

推荐:国内项目优先用可灵或即梦,二选一后全程使用。

工作流程

流程 A:创建数字人

输入: 形象描述 / 真人照片

选择后端

调用 API 生成

输出: avatar_id + 预览图

流程 B:生成口播视频

输入: avatar_id + 台词文本/音频

调用后端口播 API

等待渲染

输出: 视频文件 URL

输入参数

创建数字人

参数必填说明
modecreate
backend
- | kling / jimeng / heygen / d-id / synthesia | | description | △ | 形象描述(二选一)| | photo | △ | 真人照片路径(二选一)| | style | - | realistic / cartoon / 3d | | gender | - | male / female |

声纹克隆(可选)

参数必填说明
modevoice_clone
backend
- | kling / jimeng(需支持)| | audio_sample | ✓ | 音频样本(10s-3min)| | name | - | 声纹名称 |

输出:voice_id,后续生成口播时使用。

生成口播视频

参数必填说明
modegenerate
backend
- | 同上 | | avatar_id | ✓ | 数字人 ID | | text | △ | 台词文本(三选一)| | audio | △ | 音频文件路径(三选一)| | voice_id | △ | 克隆声纹 ID + text(三选一)| | emotion | - | neutral / happy / serious | | speed | - | 语速 0.5-2.0(默认1.0)|

输出格式

创建数字人

yaml
avatar:
id: avatar_abc123
backend: jimeng
preview_url: https://...
style: realistic
created_at: 2024-01-01T00:00:00Z

生成口播视频

yaml
video:
id: video_xyz789
avatarid: avatarabc123
url: https://...
duration: 15.5
status: completed

后端配置

在 openclaw.json 中配置(只需配置你选用的后端):

Kling 可灵(推荐)

json
{
kling: {
accesskey: youraccess_key,
secretkey: yoursecret_key
}
}

Jimeng 即梦

json
{
jimeng: {
api_key: ak-xxxxxxxx
}
}

HeyGen

json
{
heygen: {
api_key: xxx
}
}

详见 references/backend-setup.md

使用示例

从描述创建

用户:帮我创建一个数字人,25岁左右的职业女性,干练短发

执行:

  1. 1. mode=create, description=25岁职业女性,干练短发, style=realistic
  2. 调用 Jimeng API
  3. 返回 avatar_id

从照片创建

用户:用这张照片创建数字人 [附图]

执行:

  1. 1. mode=create, photo=<图片路径>
  2. 调用 API 上传照片
  3. 返回 avatar_id

生成口播

用户:用 avatar_abc123 说这段话:大家好,今天教大家...

执行:

  1. 1. mode=generate, avatarid=avatarabc123, text=大家好...
  2. 调用口播 API
  3. 等待渲染完成
  4. 返回视频 URL

与上下游对接

上游:video-script-generator 输出的 narration 字段

下游:scene-video-generator / video-stitcher 消费口播视频

注意事项

  1. 1. 真人照片需获得授权
  2. 商用需确认后端的版权协议
  3. 口播视频渲染可能需要 1-5 分钟
  4. 建议缓存 avatar_id 避免重复创建

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 digital-avatar-1776094322 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 digital-avatar-1776094322 技能

通过命令行安装

skillhub install digital-avatar-1776094322

下载

⬇ 下载 digital-avatar v1.0.0(免费)

文件大小: 3.94 KB | 发布时间: 2026-4-14 12:57

v1.0.0 最新 2026-4-14 12:57
Initial release

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部