返回顶部
s

smart-model-switcher-v5智能模型切换

智能模型自动切换 V5.0.2 - 多模态感知,自动识别图片/视频/音频/代码/文本任务,切换到最适合的模型。支持图片理解(qwen3-vl-plus)、视频音频(qwen3.5-plus)、代码(glm-5)、Office文档(MiniMax-M2.5)、推理等场景。零感知切换,无需手动操作。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.1.0
安全检测
已通过
295
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

smart-model-switcher-v5

🧠 智能模型切换器 V5.0.2(多模态感知增强版)

自动识别任务类型 • 智能切换最优模型 • 零感知 • 无需手动

🎯 V5.0.2 核心升级

特性V4V5.0.2
多模态感知✅ 图片✅ 图片 + 视频 + 音频
Office 模式
❌ 无 | ✅ MiniMax-M2.5 | | 视频理解 | ❌ 不支持 | ✅ 自动切换 qwen3.5-plus | | 音频理解 | ❌ 不支持 | ✅ 自动切换 qwen3.5-plus | | 主窗口限制 | ❌ 无限制 | ✅ 仅主窗口生效,子代理不切换 | | 任务感知 | 智能上下文分析 | 智能上下文分析 + 文件检测 |

⚠️ 核心规则:主窗口限制

🔒 智能切换仅限主窗口

智能模型切换只对主窗口(主会话)生效!

会话类型是否执行智能切换说明
主窗口✅ 执行用户直接对话的会话(飞书、WebChat、Telegram 等)
子代理
❌ 不执行 | 团队成员办公室(马云CEO、技术专家、市场猎手等) |
| Spawned Session | ❌ 不执行 | 通过 sessions_spawn 创建的所有会话 |

为什么这样设计?

  1. 1. 子代理有固定模型 - 各专业人员的模型是预设的(技术专家用 glm-5,推理用 qwq-plus)
  2. 避免干扰 - 智能切换不应该覆盖子代理的专业模型配置
  3. 职责分明 - 主窗口处理用户意图,子代理专注执行任务

判断方式

当前会话是主窗口?
├── YES → 执行智能切换逻辑
└── NO → 跳过切换,使用该会话预设模型

检测方法

  • - 主窗口:depth = 0 或无 subagent context 标记
  • 子代理:消息开头有 [Subagent Context] 或 depth > 0



🖼️ 多模态模型列表

视觉/音视频模型(支持图片/视频/音频)
模型 IDProvider能力推荐场景
qwen3.5-plusBailian图片/视频/音频 ⭐⭐⭐⭐⭐多模态任务首选
qwen3-vl-plus
Bailian | 图片 ⭐⭐⭐⭐⭐ | 纯图片理解、OCR |

| qvq-max | Bailian | 图片 ⭐⭐⭐⭐⭐ | 复杂视觉推理 | | glm-4v | GLM | 图片 ⭐⭐⭐⭐ | 图片理解 |

代码模型(编程专用)
模型 IDProvider代码能力推荐场景
glm-5Bailian/GLM⭐⭐⭐⭐⭐代码生成、Debug、重构
qwen3-coder-plus
Bailian | ⭐⭐⭐⭐⭐ | 代码补全、项目开发 |

| qwen-coder-turbo | Bailian | ⭐⭐⭐⭐ | 快速代码任务 |

推理模型(复杂思维)
模型 IDProvider推理能力推荐场景
qwq-plusBailian⭐⭐⭐⭐⭐复杂推理、数学证明
qwen3-max
Bailian | ⭐⭐⭐⭐⭐ | 深度思考、分析 |

| glm-5 | Bailian/GLM | ⭐⭐⭐⭐ | 逻辑推理 |

Office 文档模型
模型 IDProvider能力推荐场景
MiniMax-M2.5Bailian⭐⭐⭐⭐⭐Office 文档处理

通用模型
模型 IDProvider综合能力推荐场景
qwen3.5-plusBailian⭐⭐⭐⭐日常对话、写作、翻译
qwen-plus
Bailian | ⭐⭐⭐ | 快速任务 |

| qwen-turbo | Bailian | ⭐⭐ | 简单任务、低成本 |

🔄 自动切换规则

规则 0: 主窗口检测(最高优先级)

IF 当前会话不是主窗口 → 跳过所有切换逻辑,使用预设模型

规则 1: 多模态检测优先(图片/视频/音频)

IF 消息包含图片/视频/音频 → 切换到 qwen3.5-plus
├── 图片 + 代码相关 → qwen3.5-plus (视觉+代码)
├── 视频文件 → qwen3.5-plus (唯一支持视频)
├── 音频文件 → qwen3.5-plus (唯一支持音频)
└── 纯图片理解 → qwen3-vl-plus 或 qwen3.5-plus

视频文件扩展名:.mp4, .avi, .mov, .mkv, .wmv, .flv, .webm, .m4v

音频文件扩展名:.mp3, .wav, .m4a, .ogg, .flac, .aac, .wma

图片文件扩展名:.png, .jpg, .jpeg, .gif, .webp, .bmp, .svg

规则 2: 代码任务

IF 消息包含代码关键词 → 切换到代码模型
├── 复杂代码任务 → glm-5 (最强代码)
├── 快速代码补全 → qwen-coder-turbo
└── 项目级开发 → qwen3-coder-plus

规则 3: 推理任务

IF 消息包含推理关键词 → 切换到推理模型
├── 复杂推理 → qwq-plus (最强推理)
├── 数学/证明 → qwen3-max
└── 一般分析 → glm-5

规则 4: Office 模式

IF 用户说 Office模式 / 切换Office / MiniMax → 切换到 MiniMax-M2.5
└── Office 文档处理 → MiniMax-M2.5

规则 5: 文本任务

IF 纯文本任务 → 使用通用模型
├── 长文档 → qwen3.5-plus (1M context)
├── 写作/翻译 → qwen3.5-plus
└── 简单对话 → qwen-plus / qwen-turbo

📋 切换决策树(完整版)

收到消息

├── 🔒 是否为主窗口(主会话)?
│ ├── NO → 跳过切换,使用该会话预设模型
│ │
│ └── YES ↓

├── 🖼️ 包含图片/视频/音频?
│ ├── 视频文件 (.mp4/.avi/.mov/.mkv/...) → qwen3.5-plus ⭐多模态优先
│ ├── 音频文件 (.mp3/.wav/.m4a/.ogg/...) → qwen3.5-plus ⭐多模态优先
│ ├── 图片 + 代码关键词 → qwen3.5-plus (视觉+代码)
│ └── 纯图片 → qwen3-vl-plus 或 qwen3.5-plus

├── 💻 代码关键词?
│ └── YES → glm-5 (最强代码)

├── 🧠 推理关键词?
│ └── YES → qwq-plus / qwen3-max

├── 📎 Office 关键词?
│ └── YES → MiniMax-M2.5

└── 📝 通用任务 → qwen3.5-plus

🎯 关键词识别

多模态检测(最高优先级)

  • - 图片:消息中有 image 类型内容,文件扩展名 .png, .jpg, .jpeg, .gif, .webp, .bmp
  • 视频:文件扩展名 .mp4, .avi, .mov, .mkv, .wmv, .flv, .webm, .m4v
  • 音频:文件扩展名 .mp3, .wav, .m4a, .ogg, .flac, .aac, .wma
  • 用户说:看这个图、

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 smart-model-switcher-v2-1776180782 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 smart-model-switcher-v2-1776180782 技能

通过命令行安装

skillhub install smart-model-switcher-v2-1776180782

下载

⬇ 下载 smart-model-switcher-v5 v2.1.0(免费)

文件大小: 9.37 KB | 发布时间: 2026-4-15 13:42

v2.1.0 最新 2026-4-15 13:42
**Smart Model Switcher now features multimodal awareness, enhanced Office mode, and main-window-only switching.**

- Added automatic detection and model switching for video (.mp4, .avi, .mov, .mkv, etc.) and audio (.mp3, .wav, .m4a, .ogg, etc.) files.
- Introduced Office mode supporting MiniMax-M2.5 for Office document processing.
- Implemented "main window restriction": intelligent model switching now only occurs in the main chat window; subagents always use their preset models.
- Clarified model assignment rules: GLM-5 is for pure coding tasks only; qwen3.5-plus prioritized for all multimodal inputs.
- Updated decision logic and keyword rules for more accurate task-type recognition.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部