返回顶部
i

image-generator

Generate images via BigModel APIs and send them as chat images (e.g. Feishu). Invoke when user asks to create a single picture with specific style/size.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
313
下载量
2
收藏
概述
安装方式
版本历史

image-generator

# CogView-3-Flash Skill 基于智谱/BigModel 的 `cogview-3-flash` 文生图接口,提供**快速单张图片生成**能力。 ## Features - 使用 `https://open.bigmodel.cn/api/paas/v4/images/generations` 接口 - 支持通过环境变量 `ZHIPU_API_KEY` 配置鉴权 Token - 支持 `cogview-3-flash` 与 `glm-image` 两类模型 - 作为 OpenClaw Skill 使用:当用户在对话中请求生成图片时,由 Agent 调用本技能,自动执行 `scripts/generate.py`,根据提示词和尺寸生成图片并返回本地文件路径 - 简单参数:提示词、尺寸、水印开关 ## Setup 1. 从对应平台控制台获取 API Key/Token 2. 在终端中设置环境变量: ```bash export ZHIPU_API_KEY="你的 API Key" ``` 或在工具配置中以同名变量注入。 ## Models & Sizes 在脚本中通过 `--model` 选择模型: - `cogview`:对应 `cogview-3-flash`(默认) - `glm`:对应 `glm-image` 各模型推荐尺寸与限制: - `glm-image` 推荐枚举值:`1280x1280`(默认), `1568x1056`, `1056x1568`, `1472x1088`, `1088x1472`, `1728x960`, `960x1728` 自定义尺寸: 长宽推荐在 `1024px-2048px` 范围内, 最大像素数不超过 `2^22`,长宽需为 `32` 的整数倍。 - 其它模型(如 `cogview-3-flash`)推荐枚举值:`1024x1024`(默认), `768x1344`, `864x1152`, `1344x768`, `1152x864`, `1440x720`, `720x1440` 自定义尺寸: 长宽需在 `512px-2048px` 范围内, 最大像素数不超过 `2^21`,长宽需为 `16` 的整数倍。 ## Usage ### 命令行生成图片 ```bash python scripts/generate.py \ "两只可爱的小猫咪,坐在阳光明媚的窗台上,背景是蓝天白云。" \ --model cogview \ --size 1024x1024 \ --no-watermark \ --output cats.png ``` ### 参数说明 - `prompt`:必填,中文或英文提示词 - `--model`:模型选择,`cogview`(默认)/`glm` - `--size`:图片尺寸,不传则使用所选模型默认尺寸 - `--watermark`:开启水印(默认开启) - `--no-watermark`:关闭水印 - `--output` / `-o`:指定输出文件名,默认自动生成 ## API 行为说明 - 接口返回 JSON,格式类似: ```json { "created": 1773146620, "data": [ { "url": "https://.../image.png" } ], "id": "20260310204340ad2bd838dcb64c7f", "request_id": "20260310204340ad2bd838dcb64c7f" } ``` - 本 Skill 会自动解析 `data[0].url`,下载图片并保存到本地。 ## 在 Feishu 中的使用(给 Agent 的操作指引) 当用户在 Feishu 对话中请求你生成图片时,请按下面步骤操作: 1. 使用系统运行工具,在 `{baseDir}` 目录下执行命令,根据用户的提示词和期望尺寸构造参数,例如: - `python {baseDir}/scripts/generate.py "<用户提示词>" --model cogview --size "<宽x高>" --no-watermark --output "/root/.openclaw/workspace/images/cogview-{时间戳}.png"` 2. 从脚本标准输出中找到形如 `✅ 图片已保存: /path/to/image.png` 的一行,并解析出其中的本地图片路径。 3. 使用 Feishu 的发送图片能力,将该图片文件直接作为图片消息发送到当前会话,而不是只把本地路径文本返回给用户。 4. 在文字回复中简单说明图片信息(模型、尺寸、提示词等),同时附上生成的图片。 ## 示例 ```bash # 使用 cogview-3-flash,默认尺寸 python scripts/generate.py "一幅赛博朋克城市夜景,霓虹灯与雨夜" -o cyberpunk.png # 使用 glm-image,自定义尺寸 + 关闭水印 python scripts/generate.py \ "可爱风格的猫咪插画" \ --model glm \ --size 1280x1280 \ --no-watermark ```

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 zhipu-image-generator-1776377282 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 zhipu-image-generator-1776377282 技能

通过命令行安装

skillhub install zhipu-image-generator-1776377282

下载 Zip 包

⬇ 下载 image-generator v1.0.0

文件大小: 6.06 KB | 发布时间: 2026-4-17 16:39

v1.0.0 最新 2026-4-17 16:39
Generate images via BigModel APIs and send them as chat images (e.g. Feishu). Invoke when user asks to create a single picture with specific style/size.(智谱免费API生成图像)

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部