返回顶部
i

image-gen图像生成

Generate images using multiple AI models — Midjourney (via Legnext.ai), Flux, Nano Banana Pro (Gemini), Ideogram, Recraft, and more via fal.ai. Intelligently routes to the best model based on use case.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.0.1
安全检测
已通过
3,250
下载量
免费
免费
4
收藏
概述
安装方式
版本历史

image-gen

图像生成技能

本技能根据每个用例使用最佳AI模型生成图像。模型选择是最重要的决策 — 生成前请仔细阅读调度逻辑。



🧠 智能调度逻辑

始终根据用户的实际需求选择模型,而非仅看请求表面。

决策树

请求是否涉及共享角色、场景或故事连续性的多张图像?
├─ 是 → 使用 NANO BANANA (Gemini)
│ 原因:Gemini能整体理解上下文;支持reference_images
│ 以保持系列图像(分镜图、漫画、序列)中的角色/场景一致性

└─ 否 → 是否为单张独立图像?
├─ 艺术/电影感/绘画感/高度细节化?
│ → 使用 MIDJOURNEY

├─ 照片级真实感/肖像/产品照片?
│ → 使用 FLUX PRO

├─ 包含文字(标志、海报、标牌、信息图)?
│ → 使用 IDEOGRAM

├─ 矢量/图标/扁平设计/品牌素材?
│ → 使用 RECRAFT

├─ 快速草稿/快速迭代(速度优先)?
│ → 使用 FLUX SCHNELL (<2秒)

└─ 通用/平衡型?
→ 使用 FLUX DEV

模型能力矩阵

模型ID艺术性照片真实感文字上下文连续性速度成本
Midjourneymidjourney⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐❌(无上下文)~30秒~$0.05
Nano Banana Pro
nano-banana | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ~20秒 | $0.15 | | Flux Pro | flux-pro | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ❌ | ~5秒 | ~$0.05 | | Flux Dev | flux-dev | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐ | ❌ | ~8秒 | ~$0.03 | | Flux Schnell | flux-schnell | ⭐⭐ | ⭐⭐⭐ | ⭐⭐ | ❌ | <2秒 | ~$0.003 | | Ideogram v3 | ideogram | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ❌ | ~10秒 | ~$0.08 | | Recraft v3 | recraft | ⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ | ❌ | ~8秒 | ~$0.04 | | SDXL Lightning | sdxl | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ | ❌ | ~3秒 | ~$0.01 |

何时使用Nano Banana(关键)

当用户的请求涉及以下内容时,使用 Nano Banana

  • - 分镜图 / ストーリーボード:用相同角色讲述故事的多个画面
  • 漫画 / コミック:具有一致角色的连续画格
  • 角色系列:同一人物/角色在不同姿势或场景中的多张图像
  • 场景延续:现在展示同一个女孩在森林中(引用之前的图像)
  • 风格一致性:必须共享相同视觉风格/世界的一组图像

Nano Banana使用Google Gemini 3 Pro多模态架构,能整体理解上下文而非关键词匹配。它支持最多14张参考图像以保持角色和场景一致性。



如何使用本技能

  1. 1. 分析请求:是单张图像还是系列图像?是否需要上下文连续性?
  2. 选择模型:使用上述决策树。
  3. 优化提示词:添加适合模型的风格、光照和质量描述词。
  4. 告知用户:告诉他们你正在使用哪个模型及原因,并告知生成已开始。
  5. 运行脚本:使用exec工具并设置足够的超时时间。
  6. 交付结果:将图像URL发送给用户。

调用生成脚本

bash
node {baseDir}/generate.js \
--model <模型ID> \
--prompt <优化后的提示词> \
[--aspect-ratio <比例>] \
[--num-images <1-4>] \
[--negative-prompt <负面提示词>] \
[--reference-images ]

参数说明:

  • - --model:可选值 midjourney、flux-pro、flux-dev、flux-schnell、sdxl、nano-banana、ideogram、recraft
  • --prompt:图像生成提示词(必填)
  • --aspect-ratio:例如 16:9、1:1、9:16、4:3、3:4(默认:1:1)
  • --num-images:1-4(默认:1;Midjourney始终返回4张)
  • --negative-prompt:要避免的内容(Midjourney不支持)
  • --reference-images:用于上下文/角色一致性的图像URL,以逗号分隔(仅Nano Banana
  • --mode:Midjourney速度模式:turbo(默认,约20-40秒)、fast(约30-60秒)、relax(免费但慢)

exec超时时间:Midjourney和Nano Banana至少设置 120秒;Flux Schnell 30秒足够。



⚡ Midjourney工作流程(同步模式 — 不使用--async)

始终使用同步模式(不使用--async)。脚本会在内部等待直到完成。

bash
node {baseDir}/generate.js \
--model midjourney \
--prompt <优化后的提示词> \
--aspect-ratio 16:9

理解Midjourney输出

json
{
success: true,
model: midjourney,
jobId: xxxxxxxx-...,
imageUrl: https://cdn.legnext.ai/temp/....png,
imageUrls: [
https://cdn.legnext.ai/mj/xxxx_0.png,
https://cdn.legnext.ai/mj/xxxx_1.png,
https://cdn.legnext.ai/mj/xxxx_2.png,
https://cdn.legnext.ai/mj/xxxx_3.png
]
}

关键 — image字段含义:

字段含义使用时机
imageUrl所有4张图像的 2×2网格合成图作为预览发送,让用户看到所有选项
imageUrls[0]
图像1(左上) | 用户想要图像1时发送 |
| imageUrls[1] | 图像2(右上) | 用户想要图像2时发送 |
| imageUrls[2] | 图像3(左下) | 用户想要图像3时发送 |
| imageUrls[3] | 图像4(右下) | 用户想要图像4时发送 |

放大第N张 / 要第N张 / give me image N = 直接发送 imageUrls[N-1]。不要再次调用generate.js。

Midjourney交互流程

生成后:

🎨 生成完成!这是4张图的预览:

预览图

你喜欢哪一张?回复1、2、3或4,我直接发给你高清单图。

当用户选择图像N时:

这是第N张的单独高清图:

图片N




🤖 Nano Banana (Gemini) 工作流程

用于分镜图、角色系列以及任何依赖上下文的多人图像生成。

单张图像(无参考)

bash node {baseDir}/generate.js \ --model nano-banana \ --prompt <详细场景描述> \ --aspect-ratio 16:9

带参考图像(角色/场景一致性)

bash node {baseDir}/generate.js \ --model nano-banana \ --prompt <场景描述,引用参考图像中的角色/风格> \ --aspect-ratio 16:9 \ --reference-images https://上一张图像url-1.png,https://上一张图像url-2.png

如何构建分镜图系列:

  1. 1. 生成第一帧时不使用参考图像(建立角色/场景)
  2. 使用第一帧的URL作为第二帧的--reference-images
  3. 对于后续帧,使用最近的

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 image-gen-1776090014 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 image-gen-1776090014 技能

通过命令行安装

skillhub install image-gen-1776090014

下载

⬇ 下载 image-gen v2.0.1(免费)

文件大小: 10.65 KB | 发布时间: 2026-4-15 13:03

v2.0.1 最新 2026-4-15 13:03
Minor updates

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部