Token Tracker

作者： zruler
博客： https://www.zruler.fun/
邮箱： zruler@163.com
反馈： 有问题请及时反馈！欢迎提出问题和建议。

报告当前对话的Token使用量和预估费用。

触发时机

1. 用户主动询问 — 如token用了多少、花了多少钱、cost、usage等
长对话结束 — 复杂任务完成后主动报告
用户请求总结 — 明确要求查看用量统计

快速使用

调用session_status获取当前会话指标，然后格式化为用户友好的摘要。

回复格式

获取session_status后，按以下格式报告：

📊 本次对话用量

🧮 Tokens: {输入} 入 / {输出} 出
💵 费用: ${费用}
🗄️ 缓存: {缓存命中率}% 命中 ({缓存量} 缓存 / {新增量} 新)
📚 上下文: {已用}/{上限} ({百分比}%)

模型定价参考（每100万Token，美元）

模型	输入	输出	缓存输入
claude-sonnet-4-20250514	$3	$15	$0.30
claude-opus-4-20250514

$15 | $75 | $1.50 | | gpt-4o | $2.50 | $10 | $1.25 | | gpt-4o-mini | $0.15 | $0.60 | $0.075 | | o1 | $15 | $60 | $7.50 | | o3-mini | $1.10 | $4.40 | $0.55 | | gemini-2.0-flash | $0.10 | $0.40 | $0.025 | | gemini-2.5-pro | $1.25-$2.50 | $10-$15 | - | | deepseek-chat | $0.27 | $1.10 | $0.07 | | deepseek-reasoner | $0.55 | $2.19 | $0.14 |

注意：session_status返回的实际费用具有权威性。此表格仅供参考。

使用技巧

- 对于长对话，建议在上下文使用率超过80%时进行压缩
关注缓存命中率 — 高缓存意味着实际费用更低
如果用户询问历史用量，请说明此功能仅追踪当前会话

token-tracker令牌追踪器

token-tracker

Token Tracker

When to Trigger

Quick Usage

Response Format

Model Pricing Reference (USD per 1M tokens)

Usage Tips

Token Tracker

触发时机

快速使用

回复格式

模型定价参考（每100万Token，美元）

使用技巧

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

token-tracker令牌追踪器

token-tracker

Token Tracker

When to Trigger

Quick Usage

Response Format

Model Pricing Reference (USD per 1M tokens)

Usage Tips

Token Tracker

触发时机

快速使用

回复格式

模型定价参考（每100万Token，美元）

使用技巧

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement