返回顶部
b

baoyu-image-gen 图像生成

AI image generation with OpenAI, Google, DashScope and Replicate APIs. Supports text-to-image, reference images, aspect ratios. Sequential by default; parallel generation available on request. Use when user asks to generate, create, or draw images.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
1,864
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

baoyu-image-gen

图像生成(AI SDK)

基于官方API的图像生成。支持OpenAI、Google、DashScope(阿里通义万象)和Replicate提供商。

脚本目录

代理执行

  1. 1. SKILLDIR = 此SKILL.md文件所在目录
  2. 脚本路径 = ${SKILLDIR}/scripts/main.ts

第0步:加载偏好设置 ⛔ 阻塞

关键:此步骤必须在任何图像生成之前完成。请勿跳过或延迟。

检查EXTEND.md是否存在(优先级:项目 → 用户):

bash
test -f .baoyu-skills/baoyu-image-gen/EXTEND.md && echo project
test -f $HOME/.baoyu-skills/baoyu-image-gen/EXTEND.md && echo user

结果操作
找到加载、解析、应用设置。如果defaultmodel.[provider]为null → 仅询问模型(流程2)
未找到
⛔ 运行首次设置(references/config/first-time-setup.md)→ 保存EXTEND.md → 然后继续 |

关键:如果未找到,在生成任何图像之前,使用AskUserQuestion完成完整设置(提供商 + 模型 + 质量 + 保存位置)。在创建EXTEND.md之前,生成将被阻塞。

路径位置
.baoyu-skills/baoyu-image-gen/EXTEND.md项目目录
$HOME/.baoyu-skills/baoyu-image-gen/EXTEND.md
用户主目录 |

EXTEND.md支持:默认提供商 | 默认质量 | 默认宽高比 | 默认图像尺寸 | 默认模型

模式:references/config/preferences-schema.md

用法

bash

基础


npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt A cat --image cat.png

带宽高比

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt A landscape --image out.png --ar 16:9

高质量

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt A cat --image out.png --quality 2k

从提示文件

npx -y bun ${SKILL_DIR}/scripts/main.ts --promptfiles system.md content.md --image out.png

带参考图像(Google多模态或OpenAI编辑)

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt Make blue --image out.png --ref source.png

带参考图像(显式提供商/模型)

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt Make blue --image out.png --provider google --model gemini-3-pro-image-preview --ref source.png

指定提供商

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt A cat --image out.png --provider openai

DashScope(阿里通义万象)

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt 一只可爱的猫 --image out.png --provider dashscope

Replicate(google/nano-banana-pro)

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt A cat --image out.png --provider replicate

Replicate带指定模型

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt A cat --image out.png --provider replicate --model google/nano-banana

选项

选项描述
--prompt <text>, -p提示文本
--promptfiles <files...>
从文件读取提示(拼接) | | --image | 输出图像路径(必需) | | --provider google\|openai\|dashscope\|replicate | 强制指定提供商(默认:google) | | --model , -m | 模型ID(Google:gemini-3-pro-image-preview,gemini-3.1-flash-image-preview;OpenAI:gpt-image-1.5) | | --ar | 宽高比(例如:16:9,1:1,4:3) | | --size | 尺寸(例如:1024x1024) | | --quality normal\|2k | 质量预设(默认:2k) | | --imageSize 1K\|2K\|4K | Google的图像尺寸(默认:根据质量) | | --ref | 参考图像。支持Google多模态(gemini-3-pro-image-preview,gemini-3-flash-preview,gemini-3.1-flash-image-preview)和OpenAI编辑(GPT图像模型)。如果省略提供商:先Google,然后OpenAI | | --n | 图像数量 | | --json | JSON输出 |

环境变量

变量描述
OPENAIAPIKEYOpenAI API密钥
GOOGLEAPIKEY
Google API密钥 | | DASHSCOPEAPIKEY | DashScope API密钥(阿里云) | | REPLICATEAPITOKEN | Replicate API令牌 | | OPENAIIMAGEMODEL | OpenAI模型覆盖 | | GOOGLEIMAGEMODEL | Google模型覆盖 | | DASHSCOPEIMAGEMODEL | DashScope模型覆盖(默认:z-image-turbo) | | REPLICATEIMAGEMODEL | Replicate模型覆盖(默认:google/nano-banana-pro) | | OPENAIBASEURL | 自定义OpenAI端点 | | GOOGLEBASEURL | 自定义Google端点 | | DASHSCOPEBASEURL | 自定义DashScope端点 | | REPLICATEBASEURL | 自定义Replicate端点 |

加载优先级:CLI参数 > EXTEND.md > 环境变量 > /.baoyu-skills/.env > ~/.baoyu-skills/.env

Replicate模型配置

使用--provider replicate时,可以通过以下方式配置模型(优先级从高到低):

  1. 1. CLI标志:--model
  2. EXTEND.md:defaultmodel.replicate
  3. 环境变量:REPLICATEIMAGE_MODEL
  4. 内置默认值:google/nano-banana-pro

支持的模型格式:

  • - owner/name(推荐用于官方模型),例如google/nano-banana-pro
  • owner/name:version(社区模型按版本),例如stability-ai/sdxl:

示例:

bash

使用Replicate默认模型


npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt A cat --image out.png --provider replicate

显式覆盖模型

npx -y bun ${SKILL_DIR}/scripts/main.ts --prompt A cat --image out.png --provider replicate --model google/nano-banana

提供商选择

  1. 1. 提供--ref且未指定--provider → 自动选择Google优先,然后OpenAI,最后Replicate
  2. 指定了--provider → 使用该提供商(如果使用了--ref,必须是google、openai或replicate)
  3. 仅有一个API密钥可用 → 使用该提供商
  4. 多个可用 → 默认使用Google

质量预设

预设Google imageSizeOpenAI尺寸使用场景
normal1K1024px快速预览
2k(默认)
2K | 2048px | 封面、插图、信息图表 |

Google imageSize:可通过--imageSize 1K|2K|4K覆盖

宽高比

支持:1:1,16:9,9:16,4:3,3:4,2.35:1

  • - Google多模态:使用imageConfig.aspectRatio
  • Google Imagen:使用aspectRatio参数
  • OpenAI:映射到最接近的支持尺寸

生成模式

默认:顺序生成(一次一张图像)。这确保稳定的输出和更简单的调试。

并行生成:仅在用户明确请求并行/并发生成时使用。

模式使用时机
顺序(默认)正常使用、单张图像、小批量
并行
用户明确请求、大批

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 baoyu-image-gen-1776199103 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 baoyu-image-gen-1776199103 技能

通过命令行安装

skillhub install baoyu-image-gen-1776199103

下载

⬇ 下载 baoyu-image-gen v1.0.0(免费)

文件大小: 19.38 KB | 发布时间: 2026-4-15 13:05

v1.0.0 最新 2026-4-15 13:05
Initial release of baoyu-image-gen: a multi-provider API-based image generation tool.

- Supports image generation via OpenAI, Google, DashScope, and Replicate APIs.
- Allows text prompts, reference images, aspect ratios, image size, and quality presets.
- Provider, model, and defaults configurable via CLI flags, EXTEND.md, and environment variables.
- Ensures a blocking setup with EXTEND.md before image generation; guides first-time configuration.
- Sequential generation is default; parallel mode available upon explicit user request.
- Robust error handling with user setup hints and auto-retries for failed generations.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部