返回顶部
c

context-budget-optimizer上下文预算优化

# Context Budget Optimizer

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
270
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

context-budget-optimizer

上下文预算优化器

框架:Token效率矩阵
价值每小时200美元的顾问时间。仅需19美元。



该技能的作用

审计你的智能体在每个上下文层中的Token使用情况,识别你在臃肿内容上浪费预算的地方,并生成一份包含具体实施步骤的3周成本削减路线图。

解决的问题: 每月AI成本达到200-500美元的重度用户,其上下文中通常存在60-70%的浪费。其中大部分是看不见的:系统提示中的过时文件、冗余的技能加载、过大的记忆文件、错误的模型选择。Token效率矩阵让这些浪费变得可见且可排序。



Token效率矩阵

一个四象限审计工具,根据成本(Token权重)和ROI(每个Token带来的价值)对每个上下文元素进行评分。高成本+低ROI = 优先削减。

矩阵

高ROI

保留 │ 优化
(高ROI, │ (高ROI,
低成本) │ 高成本)

低成本 ──────────────┼────────────────── 高成本

审计 │ 削减
(低ROI, │ (低ROI,
低成本) │ 高成本)

低ROI

各象限行动:

  • - 保留: 不要动。它运行效率很高。
  • 优化: 压缩或延迟加载。有价值,但成本高。
  • 审计: 每季度审查。成本低所以不紧急,但应质疑其ROI。
  • 削减: 立即删除。你在为无价值的东西付费。



第一阶段:上下文清单

在评分之前,先映射智能体上下文中的所有内容。

待审计的上下文层

层A:系统提示 / SOUL.md / 身份文件
层B:活跃技能(每次会话加载)
层C:记忆文件(MEMORY.md、每日笔记)
层D:启动时注入的项目文件
层E:上下文中的工具输出 / MCP响应
层F:聊天历史(保留在上下文中的对话轮次)
层G:读入上下文中的代码或数据文件

清单模板

对于上下文中的每个项目,填写以下内容:

项目预估Token数每日会话数每日成本*价值(1-5分)
SOUL.mdA
MEMORY.md
C | | | | |
| [技能1].md | B | | | | |
| [技能2].md | B | | | | |
| 每日笔记 | C | | | | |
| [项目文件] | D | | | | |

*每日成本 = (预估Token数 / 1M) × 模型费率 × 每日会话数

Token估算速查表:

  • - 1页文本 ≈ 500-700 Token
  • 1个SKILL.md文件 ≈ 800-2,000 Token
  • 1个代码文件(100行)≈ 1,200-1,800 Token
  • 1个MEMORY.md(维护良好)≈ 500-1,500 Token
  • 1个MEMORY.md(被忽视/臃肿)≈ 3,000-8,000 Token

模型费率(2026年第一季度,近似值):

模型每百万Token输入成本
Claude Haiku 3.5~$0.80
Claude Sonnet 4
~$3.00 |
| Claude Opus 4 | ~$15.00 |
| GPT-4o mini | ~$0.15 |
| GPT-4o | ~$2.50 |


第二阶段:评分(Token效率矩阵)

对每个上下文项目进行评分:

成本评分(1-5分):

分数Token范围描述
1< 200 Token极小——可忽略
2
200-500 Token | 轻量 |
| 3 | 500-1,500 Token | 中等 |
| 4 | 1,500-4,000 Token | 重量 |
| 5 | > 4,000 Token | 非常重 |

ROI评分(1-5分):

分数描述
1很少使用,通用,过时
2
偶尔有用 |
| 3 | 大多数会话中中等有用 |
| 4 | 持续被引用,塑造输出 |
| 5 | 关键——没有它会话中断 |

矩阵定位:

  • - 成本1-2,ROI 4-5 → 保留
  • 成本4-5,ROI 4-5 → 优化
  • 成本1-2,ROI 1-2 → 审计
  • 成本4-5,ROI 1-2 → 削减
  • 成本3,ROI 3 → 审计(边缘情况——每季度评估)



第三阶段:削减手册

削减(立即实施)

首先消除的项目:

□ 超过90天且无引用的旧记忆条目
□ 全局加载但仅偶尔使用的技能
□ 多个文件中的重复信息
□ 系统提示中的冗长模板
□ 注入文件中的注释代码
□ 包含在上下文中的调试日志
□ 仅需摘要时却包含的完整文件内容

削减目标: Token减少30-40%,质量零损失。



优化(第1-2周实施)

策略1:延迟加载

不要在启动时加载所有技能,仅在触发时加载。

之前(急切加载):

系统提示包含所有10个技能文件 → 每次会话15,000 Token

之后(延迟加载):

系统提示仅包含技能索引 → 500 Token
按需加载单个技能 → 需要时1,000 Token
净效果:每次会话减少14,000 Token(技能节省93%)

延迟加载实现:
markdown

SKILL-INDEX.md(500 Token,而非完整技能)

可用技能——需要时加载:

  • - mcp-server-setup-kit:MCP连接设置
  • agentic-loop-designer:构建自主循环
  • context-budget-optimizer:Token成本削减
  • [等]

使用技能:使用[技能名称]技能



策略2:记忆分层

并非所有记忆都同等重要。对其进行分层。

第1层(热):始终在上下文中——当前焦点、活跃项目、今日优先事项
目标:< 500 Token
文件:FOCUS.md

第2层(温):按需加载——历史决策、已完成项目
目标:< 2,000 Token
文件:MEMORY.md(已摘要)

第3层(冷):从不自动加载——旧每日笔记、已归档项目
存储:平面文件,可按需搜索
文件:memory/archive/

记忆分层实现:

  1. 1. 创建FOCUS.md(第1层)——仅本周优先事项
  2. 将超过14天的每日笔记归档到memory/archive/
  3. 每季度摘要MEMORY.md(移除已解决项目)
  4. 设置系统提示仅注入FOCUS.md + 最近7天的记忆



策略3:压缩模板

用压缩引用替换冗长内容。

之前(臃肿的系统提示部分):

David Flynn是一位创始人,居住在德克萨斯州奥斯汀。他经营一家名为
TechCorp的公司,为物流领域的中端市场公司构建B2B SaaS产品。
他从事这项工作已有8年,之前在麦肯锡工作。他喜欢直接沟通,
不喜欢废话。他最看重指标和ROI。他的团队有6人...
[300 Token]

之后(压缩后):

所有者:David Flynn | 奥斯汀 TX | TechCorp(B2B SaaS,物流,中端市场)
背景:8年创始人,前麦肯锡 | 团队:6人
风格:直接,指标优先,无废话
[40 Token —— 减少87%]



策略4:模型降级机会

大多数上下文密集型会话不需要旗舰模型。

降级决策树:

此任务是否需要多步推理?
├── 否 → 使用Haiku(成本降低80-90%)
└── 是 → 这是新问题吗?
├── 否(熟悉模式)→ 使用Sonnet
└── 是(真正复杂)→ 使用Opus

模型节省计算器:

切换Token成本降低何时安全
Opus → Sonnet80%大多数写作、分析、运营
Sonnet → Haiku
75% | 简单读取、状态检查、格式化 |
| Op

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 context-budget-optimizer-1776192811 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 context-budget-optimizer-1776192811 技能

通过命令行安装

skillhub install context-budget-optimizer-1776192811

下载

⬇ 下载 context-budget-optimizer v1.0.0(免费)

文件大小: 5.81 KB | 发布时间: 2026-4-15 12:49

v1.0.0 最新 2026-4-15 12:49
Initial release of Context Budget Optimizer.

- Audits agent context usage to identify token waste across all context layers.
- Introduces the Token Efficiency Matrix for cost/ROI scoring and context pruning.
- Provides a practical inventory template for estimating per-item and model token costs.
- Includes a 3-phase workflow: inventory mapping, Matrix scoring, and a step-by-step cost reduction playbook.
- Offers actionable playbooks: instant cuts, lazy loading, memory tiering, content compression, and model downgrade tactics.
- Guides users to cut 30–40% token bloat with clear, prioritized actions.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部