返回顶部
m

modelsense模型感知

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
244
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

modelsense

ModelSense 技能

目的

ModelSense 帮助用户为其任务选择最佳模型和努力级别。
它不会自动路由每个请求(请使用提供者插件实现该功能)。
它是一个按需顾问:向它提问,即可获得带有推理依据的清晰建议。

触发时机

  • - 用户询问:X 任务该用哪个模型?、应该用 Opus 还是 Sonnet?、该用哪种努力级别?
  • 用户想了解某个基准测试的含义
  • 用户希望 ModelSense 自动切换会话模型

需要收集的输入(从上下文中推断,仅在确实不明确时询问)

  1. 1. 任务描述 — 用户想要做什么?
  2. 努力偏好(可选):快速 / 均衡 / 深度 / 研究
- 如果未指定,则根据任务紧急程度/复杂性推断
  1. 3. 自动切换? — 用户是否希望 ModelSense 自动应用推荐?

推荐流程

第一步 — 任务分析

从以下维度对任务进行分类:

  • - 领域:代码、数学、推理、写作、对话、文档分析、多模态、研究
  • 复杂性:简单 / 中等 / 复杂 / 研究级
  • 输出类型:文本、代码、JSON、长文本、结构化数据
  • 所需上下文长度:短(<8K)、中(8–32K)、长(32K+)、超长(100K+)
  • 特殊要求:函数调用、思考/思维链、多模态、速度敏感

第二步 — 基准匹配

将任务领域与 data/benchmarks.yaml 中的相关基准进行交叉参考。

基准最佳适用场景
HumanEval / SWE-bench代码生成、调试、工程
GPQA
研究生级科学与研究 |
| MATH / AIME | 数学推理 |
| MMLU | 通用知识、多领域问答 |
| 大海捞针 | 长上下文检索 |
| MT-Bench / Arena Elo | 对话、写作质量 |
| BBH(大基准难题) | 复杂推理、多步逻辑 |

第三步 — 努力 × 模型矩阵

努力级别目标质量典型模型层级
快速足够好、速度快Haiku / Flash / GLM
均衡
高质量、合理成本 | Sonnet / GPT-4o | | 深度 | 最佳可用、开启思考 | Opus / o3 | | 研究 | 无成本限制、最高质量 | Opus + 思考=高 |

第四步 — 提供者过滤

检查用户可用的提供者:

  • - 通过 exec 工具运行:openclaw models list(或从上下文中读取)
  • 仅推荐用户实际可用的模型
  • 当最佳选择需要用户尚未配置的提供者时,进行标记

第五步 — 输出推荐

格式:

🎯 推荐:<模型>
⚡ 努力级别:<级别>
📊 原因:<1-2句基于基准的推理依据>
🔧 特殊设置:<开启思考?函数调用?等>
💰 成本估算:<粗略的 $/M 或相对值>

备选方案:
- <模型 B> — 如果你想要更快/更便宜
- <模型 C> — 如果你想要更高质量

自动切换行为

选项 A:仅提供建议(默认)

仅输出推荐。告知用户:运行 /model <名称> 进行切换。

选项 B:切换当前会话

如果用户确认或说是的,切换/应用它: python session_status(model=<提供者/模型>)

通知用户:✅ 已为此会话切换到 X。运行 /model default 重置。

选项 C:将任务委托给最佳模型

如果用户说直接用最佳模型做: python sessions_spawn( task=<原始任务>, model=<推荐模型>, thinking=<级别> )

数据文件

  • - data/benchmarks.yaml — 基准定义、得分领先者、任务映射
  • data/models.yaml — 模型目录(通过 GitHub Actions 每周更新)

示例

用户:我需要写一份 Solidity 审计报告
→ 领域:代码 + 安全 + 长文本
→ 基准:SWE-bench, HumanEval
→ 推荐:claude-opus-4-6 配合 thinking=high,努力级别=深度

用户:快速总结这个 Slack 讨论串
→ 领域:对话,短文本
→ 推荐:claude-haiku-4-5 或 gemini-flash,努力级别=快速

用户:证明这个数学猜想
→ 领域:数学,研究级
→ 基准:MATH, AIME, GPQA
→ 推荐:o3 或 claude-opus-4-6 配合 thinking=high,努力级别=研究

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 modelsense-1776199288 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 modelsense-1776199288 技能

通过命令行安装

skillhub install modelsense-1776199288

下载

⬇ 下载 modelsense v0.1.0(免费)

文件大小: 11.27 KB | 发布时间: 2026-4-15 12:29

v0.1.0 最新 2026-4-15 12:29
- Initial release of ModelSense: an on-demand advisor to recommend the best LLM model and effort level for any user task.
- Offers clear recommendations grounded in benchmark data, user task analysis, and available providers.
- Provides rationale, cost estimates, and alternative options for different effort or quality needs.
- Supports advisory mode, auto-switching session models, and on-demand task delegation.
- Designed for interactive use when users need help choosing between models or understanding benchmark implications.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部