返回顶部
u

uni-vision-engine统一视觉引擎

Automated high-quality video generation (text-to-video, image-to-video) via a local jimeng-api Docker service. Features native OpenClaw image interception, allowing users to send images directly in chat to generate videos without any UI.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
363
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

uni-vision-engine

Uni Vision Engine (v1.2.0)

该技能利用本地 jimeng-api Docker 服务,使AI代理能够通过有效的 sessionid 完全控制高质量的图像转视频和文本转视频生成。

🌟 核心功能:原生聊天图像截取(最佳实践)

通过此技能,AI助手可以自动截取用户在聊天界面发送的服装/人物图像,并将其无缝传递给生成模型——无需手动进行网页上传!


当用户在聊天中发送人物/服装照片并希望将其制作成动画(例如展示服装、转身动作)时,你必须执行以下步骤:

  1. 1. 截取图像负载:使用 read 工具或原生执行流程,从聊天上下文中提取该图像的base64内容或缓存路径。将其保存为本地临时文件(例如 /tmp/target.jpg)。
  2. 切勿使用基于文本的URL或JSON格式上传图像。你必须使用Node.js的 multipart/form-data 提交物理文件流。
  3. 使用核心脚本启动视频生成任务

bash
node {baseDir}/scripts/generate.js --prompt 模特自然转身,充分展示面料光泽,极高画质,自然阳光... --image /tmp/target.jpg

  1. 4. 监控输出:生成通常需要60-310秒。监控Docker日志以获取直接的MP4链接并返回给用户。

内容审核警告(中国防火墙)

注意:由于依赖国内即梦/Seedance引擎,服装内容存在严格的自动审核。如果遇到错误 -2001(首帧图像上传失败:可能包含违规内容),这意味着图像被认为过于暴露、皮肤裸露过多或包含敏感元素。防火墙会直接拦截这些内容。不会扣除积分。如果发生这种情况,请要求用户提供其他图像或切换到Luma/Runway等海外引擎。

CLI使用方式(用于自动化脚本)

1. 文本转视频

bash node {baseDir}/scripts/generate.js --prompt 一只冲浪的柴犬 --session your_sessionid

2. 图像转视频(需要 --image 参数)

bash node {baseDir}/scripts/generate.js --prompt 模特自然转身展示服装 --image /tmp/target.jpg --session your_sessionid

注意事项:

  1. 1. 即梦账户需要足够的积分。
  2. 使用 jimeng-video-3.0-pro 每次运行扣除 50积分

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 uni-vision-engine-1776184212 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 uni-vision-engine-1776184212 技能

通过命令行安装

skillhub install uni-vision-engine-1776184212

下载

⬇ 下载 uni-vision-engine v1.0.2(免费)

文件大小: 3.45 KB | 发布时间: 2026-4-15 10:17

v1.0.2 最新 2026-4-15 10:17
- Updated documentation and description for clearer English instructions and broader accessibility.
- Removed the UI server component (`ui/server.js`), signaling a shift to fully headless, automation-focused operation.
- Skill no longer references integrated web UI; focus is now on native chat-based and script-driven image/video generation.
- Clarified workflow for automated image interception, strict file handling, and moderation/error responses.
- CLI instructions and usage examples updated for consistency with the latest workflow.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部