返回顶部
s

smart-router智能路由

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.2
安全检测
已通过
2,430
下载量
免费
免费
3
收藏
概述
安装方式
版本历史

smart-router

A.I. 智能路由器

使用分层分类系统,智能地将请求路由到最优AI模型,具备自动回退处理和成本优化功能。

工作原理(默认静默运行)

路由器透明运行——用户正常发送消息,即可获得最适合其任务的最佳模型响应。无需特殊命令。

可选可见性:在任意消息中包含 [show routing] 即可查看路由决策。

分层分类系统

路由器采用三层决策流程:

┌─────────────────────────────────────────────────────────────────┐
│ 第一层:意图检测 │
│ 对请求的主要目的进行分类 │
├─────────────────────────────────────────────────────────────────┤
│ 代码 │ 分析 │ 创意 │ 实时 │ 通用 │
│ 编写/调试 │ 研究 │ 写作 │ 新闻/直播 │ 问答/聊天 │
│ 重构 │ 解释 │ 故事 │ X/推特 │ 翻译 │
│ 审查 │ 比较 │ 头脑风暴 │ 价格 │ 总结 │
└──────┬───────┴──────┬──────┴─────┬──────┴─────┬─────┴─────┬─────┘
│ │ │ │ │
▼ ▼ ▼ ▼ ▼
┌─────────────────────────────────────────────────────────────────┐
│ 第二层:复杂度评估 │
├─────────────────────────────────────────────────────────────────┤
│ 简单($级) │ 中等($$级) │ 复杂($$$级) │
│ • 单步骤任务 │ • 多步骤任务 │ • 深度推理 │
│ • 简短回复即可 │ • 需要一定细致度 │ • 大量输出 │
│ • 事实查询 │ • 中等上下文 │ • 关键任务 │
│ → Haiku/Flash │ → Sonnet/Grok/GPT │ → Opus/GPT-5 │
└──────────────────────────┴─────────────────────┴───────────────────┘


┌─────────────────────────────────────────────────────────────────┐
│ 第三层:特殊情况覆盖 │
├─────────────────────────────────────────────────────────────────┤
│ 条件 │ 覆盖为 │
│ ─────────────────────────────────────┼─────────────────────────│
│ 上下文 >10万 tokens │ → Gemini Pro(100万上下文)│
│ 上下文 >50万 tokens │ → 仅限 Gemini Pro │
│ 需要实时数据 │ → Grok(无条件) │
│ 图像/视觉输入 │ → Opus 或 Gemini Pro │
│ 用户显式覆盖 │ → 请求的模型 │
└──────────────────────────────────────┴──────────────────────────┘

意图检测模式

代码意图

  • - 关键词:编写、代码、调试、修复、重构、实现、函数、类、脚本、API、错误、编译、测试、PR、提交
  • 提及的文件扩展名:.py、.js、.ts、.go、.rs、.java 等
  • 输入中的代码块

分析意图

  • - 关键词:分析、解释、比较、研究、理解、为什么、如何工作、评估、审查、调查、检查
  • 长形式问题
  • 帮我理解...

创意意图

  • - 关键词:写(故事/诗歌/文章)、创作、头脑风暴、想象、设计、起草、作曲
  • 虚构/叙事请求
  • 营销/文案请求

实时意图

  • - 关键词:现在、今天、当前、最新、热门、新闻、正在发生、直播、价格、比分、天气
  • X/推特提及
  • 股票/加密货币代码
  • 体育比分

通用意图(默认)

  • - 简单问答
  • 翻译
  • 总结
  • 对话交流

混合意图(检测到多个意图)

当请求包含多个明确意图时(例如:编写代码分析这些数据并以创意方式解释):
  1. 1. 识别主要意图 — 主要交付物是什么?
  2. 路由到能力最强的模型 — 混合任务需要多功能性
  3. 默认为复杂复杂度 — 多意图 = 多步骤

示例:

  • - 编写代码并解释其工作原理 → 代码(主要)+ 分析 → 路由到 Opus
  • 总结这个,以及关于它的最新新闻 → 实时优先 → Grok
  • 使用真实当前事件创作创意故事 → 实时 + 创意 → Grok(实时优先)

语言处理

非英语请求正常处理——所有支持的模型都具备多语言能力:

模型非英语支持
Opus/Sonnet/Haiku优秀(100+种语言)
GPT-5
优秀(100+种语言) |
| Gemini Pro/Flash | 优秀(100+种语言) |
| Grok | 良好(主要语言) |

意图检测仍然有效,因为:

  • - 关键词模式包含常见的非英语等价词
  • 代码意图通过文件扩展名、代码块检测(语言无关)
  • 复杂度通过查询长度估算(跨语言适用)

边缘情况: 如果因语言原因意图不明确,默认使用通用意图和中等复杂度。

复杂度信号

简单复杂度($)

  • - 短查询(<50词)
  • 单个问号
  • 快速问题、直接告诉我、简要
  • 是/否格式
  • 单位转换、定义

中等复杂度($$)

  • - 中等查询(50-200词)
  • 需要处理多个方面
  • 解释、描述、比较
  • 提供了一些上下文

复杂复杂度($$$)

  • - 长查询(>200词)或复杂任务
  • 逐步、彻底、详细
  • 多部分问题
  • 关键/重要限定词
  • 研究、分析或创意工作

路由矩阵

意图简单中等复杂
代码SonnetOpusOpus
分析
Flash | GPT-5 | Opus | | 创意 | Sonnet | Opus | Opus | | 实时 | Grok | Grok | Grok-3 | | 通用 | Flash | Sonnet | Opus |

Token耗尽与自动模型切换

当模型在会话中变得不可用时(token配额耗尽、速率限制达到、API错误),路由器会自动切换到下一个最佳可用模型,并通知用户

通知格式

当因耗尽而发生模型切换时,用户会收到通知:

┌─────────────────────────────────────────────────────────────────┐
│ ⚠️ 模型切换通知 │
│ │
│ 您的请求无法在 claude-opus-4-5 上完成 │
│ (原因:token配额耗尽)。 │
│ │
│ ✅ 请求已使用以下模型完成:anthropic/claude-sonnet-4-5 │
│ │
│ 以下响应由回退模型生成。 │
└─────────────────────────────────────────────────────────────────┘

切换原因

原因描述
token配额耗尽每日/每月token限制达到
速率限制超限
每分钟请求过多 | | 上下文窗口超限 | 输入对模型来说太大 | | API超时 | 模型响应时间过长 | | API错误 | 提供商返回错误 | | 模型不可用 | 模型暂时离线 |

实现

python
def executewithfallback(primarymodel: str, fallbackchain: list[str], request: str) -> Response:

使用自动回退和用户通知执行请求。

attempted_models = []
switch_reason = None

# 首先尝试主模型
modelstotry = [primarymodel] + fallbackchain

for model in modelstotry:
try:
response = call_model(model, request)

# 如果切换了模型,前置通知
if attempted_models:
notification = buildswitchnotification(
failedmodel=attemptedmodels[0],
reason=switch_reason,
success_model=model
)
return Response(
content=notification + \n\n---\n\n + response.content,
model_used=model,
switched=True
)

return Response(content=response.content, model_used=model, switched=False)

except TokenQuotaExhausted:
attempted_models.append(model)
switch_reason = token配额耗尽
logfallback(model, switchreason)
continue

except RateLimitExceeded:
attempted_models.append(model)
switch_reason = 速率限制超限
logfallback(model, switchreason)
continue

except ContextWindowExceeded:
attempted_

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 smart-router-1776305367 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 smart-router-1776305367 技能

通过命令行安装

skillhub install smart-router-1776305367

下载

⬇ 下载 smart-router v0.1.2(免费)

文件大小: 77.8 KB | 发布时间: 2026-4-16 16:47

v0.1.2 最新 2026-4-16 16:47
Smart-router 0.1.2 introduces state management and improved context handling.

- Added persistent state documentation (STATE.md) to clarify router behavior across sessions.
- Implemented context guard logic in new context_guard.py for enhanced context-overflow protection.
- Updated routing logic in router_gateway.py to integrate state and context checks.
- Documentation (README.md, SKILL.md) updated to reflect new features and version bump.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部