Kay Image - AI 图片生成与理解
基于 KIE AI API 的图片生成与理解工具。
⚠️ 必需凭证
使用本工具前,必须配置 API Key:
获取 KIE API Key
- 1. 访问 https://kie.ai/
- 注册并登录账号
- 进入控制台 → API 管理
- 创建 API Key 并复制
配置环境变量
CODEBLOCK0
或在 skill 目录创建 .env 文件:
CODEBLOCK1
.env 文件内容:
CODEBLOCK2
注意: 没有 API Key 将无法使用本工具的任何功能。
特性
- - 文生图: 根据文本描述生成图片
- 图生图: 基于参考图进行编辑/变换
- 图片理解: 分析图片内容(使用 GPT-5/Gemini)
- 视频理解: 分析视频内容(使用 Gemini)
- 多分辨率: 支持 1K/2K/4K 输出
- 多宽高比: 支持 1:1, 3:4, 4:3, 9:16, 16:9, 21:9 等
使用方法
基本文生图
CODEBLOCK3
指定宽高比和分辨率
CODEBLOCK4
图生图
CODEBLOCK5
图片理解
CODEBLOCK6
视频理解
kay-image --understand --video https://example.com/video.mp4 --prompt "分析这个视频"
参数说明
| 参数 | 简写 | 说明 | 默认值 |
|---|
| INLINECODE1 | INLINECODE2 | 提示词 | - |
| INLINECODE3 |
-o | 输出路径 | - |
|
--input |
-i | 参考图路径 | - |
|
--ar | - | 宽高比 | 1:1 |
|
--resolution |
-r | 分辨率 | 1K |
|
--understand |
-u | 理解模式 | false |
|
--image | - | 图片路径 | - |
|
--video | - | 视频路径 | - |
环境变量
| 变量名 | 必需 | 说明 |
|---|
| INLINECODE14 | ✅ 是 | KIE AI API 密钥 |
| INLINECODE15 |
❌ 否 | 理解功能 API 密钥(默认使用 KIE
APIKEY) |
|
LAOZHANG_API_KEY | ❌ 否 | LaoZhang API 密钥(可选) |
价格参考
- - 1K 图片: ~$0.04
- 2K 图片: ~$0.06
- 4K 图片: ~$0.09
- 图片理解: ~$0.005-0.01/张
支持的宽高比
- -
1:1 - 正方形 - INLINECODE18 - 小红书/Instagram 竖版
- INLINECODE19 - 标准横版
- INLINECODE20 - 手机竖屏
- INLINECODE21 - 宽屏
- INLINECODE22 - 超宽屏
示例
生成小红书封面
CODEBLOCK8
生成头像
CODEBLOCK9
图片风格迁移
CODEBLOCK10
OCR 文字提取
kay-image -u --image document.jpg --prompt "提取所有文字"
脚本位置
INLINECODE23
注意事项
- - 视频理解: 仅 Gemini 模型支持
- 图片格式: 支持 JPG、PNG、WebP
- 视频格式: 支持 MP4、MOV
- 文件大小: 建议图片 < 10MB,视频 < 100MB
Kay Image - AI 图片生成与理解
基于 KIE AI API 的图片生成与理解工具。
⚠️ 必需凭证
使用本工具前,必须配置 API Key:
获取 KIE API Key
- 1. 访问 https://kie.ai/
- 注册并登录账号
- 进入控制台 → API 管理
- 创建 API Key 并复制
配置环境变量
bash
export KIEAPIKEY=your-kie-api-key-here
或在 skill 目录创建 .env 文件:
bash
创建 .env 文件
nano skills/kay-image/.env
.env 文件内容:
KIEAPIKEY=your-kie-api-key-here
注意: 没有 API Key 将无法使用本工具的任何功能。
特性
- - 文生图: 根据文本描述生成图片
- 图生图: 基于参考图进行编辑/变换
- 图片理解: 分析图片内容(使用 GPT-5/Gemini)
- 视频理解: 分析视频内容(使用 Gemini)
- 多分辨率: 支持 1K/2K/4K 输出
- 多宽高比: 支持 1:1, 3:4, 4:3, 9:16, 16:9, 21:9 等
使用方法
基本文生图
bash
kay-image --prompt 一只可爱的橘猫在草地上玩耍 --output cat.png
指定宽高比和分辨率
bash
kay-image --prompt 上海外滩夜景 --output shanghai.png --ar 16:9 --resolution 2K
图生图
bash
kay-image --prompt 转换成动漫风格 --input https://example.com/photo.jpg --output anime.png
图片理解
bash
kay-image --understand --image https://example.com/photo.jpg --prompt 描述这张图片
视频理解
bash
kay-image --understand --video https://example.com/video.mp4 --prompt 分析这个视频
参数说明
| 参数 | 简写 | 说明 | 默认值 |
|---|
| --prompt | -p | 提示词 | - |
| --output |
-o | 输出路径 | - |
| --input | -i | 参考图路径 | - |
| --ar | - | 宽高比 | 1:1 |
| --resolution | -r | 分辨率 | 1K |
| --understand | -u | 理解模式 | false |
| --image | - | 图片路径 | - |
| --video | - | 视频路径 | - |
环境变量
| 变量名 | 必需 | 说明 |
|---|
| KIEAPIKEY | ✅ 是 | KIE AI API 密钥 |
| KIEUNDERSTANDINGAPIKEY |
❌ 否 | 理解功能 API 密钥(默认使用 KIEAPI_KEY) |
| LAOZHANG
APIKEY | ❌ 否 | LaoZhang API 密钥(可选) |
价格参考
- - 1K 图片: ~$0.04
- 2K 图片: ~$0.06
- 4K 图片: ~$0.09
- 图片理解: ~$0.005-0.01/张
支持的宽高比
- - 1:1 - 正方形
- 3:4 - 小红书/Instagram 竖版
- 4:3 - 标准横版
- 9:16 - 手机竖屏
- 16:9 - 宽屏
- 21:9 - 超宽屏
示例
生成小红书封面
bash
kay-image -p 清新风格护肤品封面,粉色渐变背景 -o cover.png --ar 3:4 -r 2K
生成头像
bash
kay-image -p 动漫风格女生头像,粉色头发 -o avatar.png --ar 1:1
图片风格迁移
bash
kay-image -p 转换成油画风格 -i photo.jpg -o painting.png
OCR 文字提取
bash
kay-image -u --image document.jpg --prompt 提取所有文字
脚本位置
${SKILL_DIR}/scripts/main.ts
注意事项
- - 视频理解: 仅 Gemini 模型支持
- 图片格式: 支持 JPG、PNG、WebP
- 视频格式: 支持 MP4、MOV
- 文件大小: 建议图片 < 10MB,视频 < 100MB