返回顶部
g

glm-v-modelGLM视觉模型

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
483
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

glm-v-model

GLM 视觉模型调用

本技能提供调用智谱 AI 的 GLM-4V 和 GLM-4.6V 视觉模型的能力,支持图像理解、视频分析、图表解读等功能。

支持的模型

模型说明特点
glm-4vGLM-4 视觉模型基础视觉理解
glm-4.6v
GLM-4.6V 视觉模型 | 更强的视觉理解能力,支持更长上下文 |

快速使用

基本图像理解

python
from zai import ZhipuAiClient
import base64

client = ZhipuAiClient(apikey=YOURAPI_KEY)

读取本地图片并转为 base64

with open(image.jpg, rb) as f: img_base = base64.b64encode(f.read()).decode(utf-8)

response = client.chat.completions.create(
model=glm-4.6v,
messages=[{
role: user,
content: [
{type: imageurl, imageurl: {url: fdata:image/jpeg;base64,{img_base}}},
{type: text, content: 描述这张图片}
]
}],
thinking={type: enabled}
)
print(response.choices[0].message.content)

使用图片URL

python
response = client.chat.completions.create(
model=glm-4.6v,
messages=[{
role: user,
content: [
{type: imageurl, imageurl: {url: https://example.com/image.jpg}},
{type: text, content: 这张图片里有什么?}
]
}]
)

多图理解

python
response = client.chat.completions.create(
model=glm-4.6v,
messages=[{
role: user,
content: [
{type: imageurl, imageurl: {url: 图片1 base64 或 URL}},
{type: imageurl, imageurl: {url: 图片2 base64 或 URL}},
{type: text, content: 比较这两张图片的异同}
]
}]
)

视频理解(GLM-4.6V)

python

支持理解视频内容


response = client.chat.completions.create(
model=glm-4.6v,
messages=[{
role: user,
content: [
{type: videourl, videourl: {url: 视频URL}},
{type: text, content: 描述这个视频的内容}
]
}]
)

使用脚本

项目中已包含脚本 script/infer_glmv.py,可直接调用:

python
import sys
sys.path.append(/Users/guobaokui/.openclaw/workspace_multmodal/skills/glm-v-model/script)
from inferglmv import glmv

使用方式

glm_v([image.jpg], 描述图片, glm-4.6v)

常用场景

场景Prompt 示例
图片描述详细描述这张图片的内容
图表分析
分析这张图表数据 | | 文字识别(OCR) | 提取图片中的文字 | | 物体识别 | 图片中有哪些物体 | | 场景理解 | 这是什么地方 | | 多图对比 | 比较这两张图片的异同 | | 视频理解 | 总结这个视频的内容 |

注意事项

  1. 1. API Key: 需要智谱 AI 的 API Key,可从 https://open.bigmodel.cn 获取
  2. 图片格式: 支持 JPEG、PNG、WebP 等常见格式
  3. 图片大小: 单张图片建议不超过 10MB
  4. thinking: 可启用深度思考模式 thinking={type: enabled}
  5. 计费: 按 token 计费,图片会转换为 token 消耗

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 glm-v-model-1776206506 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 glm-v-model-1776206506 技能

通过命令行安装

skillhub install glm-v-model-1776206506

下载

⬇ 下载 glm-v-model v1.0.1(免费)

文件大小: 3.35 KB | 发布时间: 2026-4-15 11:59

v1.0.1 最新 2026-4-15 11:59
No user-visible changes detected in this version.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部