图片理解

调用多模态大模型理解图片，生成精准的业务描述。

支持的模型

模型	环境变量	说明
MiniMax VLM	INLINECODE0, INLINECODE1	默认，推荐用于中文理解
OpenAI

使用方法

前提条件

设置对应模型的环境变量（至少一个）：

CODEBLOCK0

调用脚本

CODEBLOCK1

参数：

- 图片路径：本地图片文件（PNG、JPG、JPEG、GIF、WebP）
model（可选）：minimax（默认）、openai、INLINECODE6
prompt（可选）：自定义提示词

示例

CODEBLOCK2

输出

直接输出图片的业务含义描述，不再罗列元素位置，聚焦数据内容和业务逻辑。

图片理解

调用多模态大模型理解图片，生成精准的业务描述。

支持的模型

模型	环境变量	说明
MiniMax VLM	MINIMAXAPIKEY, MINIMAXAPIHOST	默认，推荐用于中文理解
OpenAI

使用方法

前提条件

设置对应模型的环境变量（至少一个）：

bash

MiniMax（默认）

export MINIMAXAPIKEY=your-minimax-key
export MINIMAXAPIHOST=https://api.minimaxi.com

或 OpenAI

export OPENAIAPIKEY=your-openai-key

或 Anthropic

export ANTHROPICAPIKEY=your-anthropic-key

调用脚本

bash
python3 /scripts/understand_image.py <图片路径> [model] [prompt]

参数：

- 图片路径：本地图片文件（PNG、JPG、JPEG、GIF、WebP）
model（可选）：minimax（默认）、openai、anthropic
prompt（可选）：自定义提示词

示例

bash

使用默认（MiniMax）

python3 ~/.openclaw/workspace/skills/minimax-image-understanding/scripts/understand_image.py /path/to/image.png

指定模型

python3 ~/.openclaw/workspace/skills/minimax-image-understanding/scripts/understand_image.py /path/to/image.png openai

自定义提示词

python3 ~/.openclaw/workspace/skills/minimax-image-understanding/scripts/understand_image.py /path/to/image.png minimax 描述图表中的数据趋势

输出

直接输出图片的业务含义描述，不再罗列元素位置，聚焦数据内容和业务逻辑。

minimax-image-understanding图片理解

minimax-image-understanding

图片理解

支持的模型

使用方法

前提条件

调用脚本

示例

输出

图片理解

支持的模型

使用方法

前提条件

MiniMax（默认）

或 OpenAI

或 Anthropic

调用脚本

示例

使用默认（MiniMax）

指定模型

自定义提示词

输出

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

minimax-image-understanding图片理解

minimax-image-understanding

图片理解

支持的模型

使用方法

前提条件

调用脚本

示例

输出

图片理解

支持的模型

使用方法

前提条件

MiniMax（默认）

或 OpenAI

或 Anthropic

调用脚本

示例

使用默认（MiniMax）

指定模型

自定义提示词

输出

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement