返回顶部
a

agent-learner智能体学习器

Benchmark and compare agent prompts and evaluation results. Use when tuning strategies, evaluating outputs, or comparing configurations.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.0.2
安全检测
已通过
389
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

agent-learner

智能体学习器

一个用于配置、基准测试、比较和优化智能体提示词及评估结果的AI工具包。智能体学习器为每个命令类别提供基于文件的持久化日志记录,包含时间戳条目、汇总统计、多格式导出以及跨所有记录的全文本搜索功能。

命令

命令描述
configure配置智能体设置 — 记录配置条目或查看最近的配置
benchmark
智能体性能基准测试 — 记录基准测试结果或查看历史记录 | | compare | 比较智能体输出 — 记录比较数据或查看最近的比较结果 | | prompt | 提示词管理 — 记录提示词变体或查看最近的提示词 | | evaluate | 评估智能体输出 — 记录评估结果或查看历史记录 | | fine-tune | 微调参数 — 记录微调会话或查看最近的微调记录 | | analyze | 分析智能体行为 — 记录分析条目或查看最近的分析结果 | | cost | 成本追踪 — 记录成本数据或查看最近的成本条目 | | usage | 使用监控 — 记录使用指标或查看最近的使用数据 | | optimize | 优化配置 — 记录优化运行或查看历史记录 | | test | 测试智能体行为 — 记录测试结果或查看最近的测试 | | report | 报告生成 — 记录报告条目或查看最近的报告 | | stats | 显示所有日志类别的汇总统计(条目数量、数据大小、首条条目日期) | | export | 以json、csv或txt格式将所有数据导出到数据目录 | | search | 跨所有日志文件进行全文本搜索(不区分大小写) | | recent | 显示活动历史日志中最近的20条条目 | | status | 健康检查 — 显示版本、数据目录、总条目数、磁盘使用情况和最近活动 | | help | 显示包含所有可用命令的完整帮助信息 | | version | 打印当前版本号 |

每个数据命令(configure、benchmark、compare等)有两种工作模式:

  • - 无参数:显示该类别最近的20条条目
  • 带参数:将输入保存为新的带时间戳条目,并报告总条目数

数据存储

所有数据以纯文本文件形式存储在数据目录下:

  • - 类别日志:$DATADIR/.log — 每个命令一个文件(例如configure.log、benchmark.log、prompt.log),每条条目格式为timestamp|value
  • 历史日志:$DATADIR/history.log — 每个执行命令的审计追踪记录,包含时间戳
  • 导出文件:$DATA_DIR/export. — 由export命令以json、csv或txt格式生成

默认数据目录:~/.local/share/agent-learner/

系统要求

  • - Bash(支持set -euo pipefail)
  • 标准Unix工具:grep、cat、date、echo、wc、du、head、tail、basename
  • 无需外部依赖或API密钥

使用场景

  1. 1. 智能体性能基准测试 — 当您需要追踪和比较不同智能体配置、模型或提示词策略下的基准测试结果时
  2. 提示词工程迭代 — 当您测试多个提示词变体并希望记录每个版本及其结果以便后续比较时
  3. 成本和使用追踪 — 当您需要监控API成本和使用指标以优化支出时
  4. 微调实验 — 当运行微调会话并希望记录参数、结果和观察结果以确保可复现性时
  5. 跨类别分析 — 当您需要搜索所有记录数据(基准测试、提示词、评估、成本)以发现模式或特定条目时

示例

bash

初始化并检查状态


agent-learner status

记录基准测试结果

agent-learner benchmark GPT-4o在MMLU上:88.7%准确率,平均延迟1.2秒

记录提示词变体

agent-learner prompt 系统:你是一个有用的编程助手。始终逐步解释你的推理过程。

比较两个配置

agent-learner compare GPT-4o vs Claude-3.5:GPT-4o快12%,Claude在代码任务上准确率高5%

追踪成本

agent-learner cost 三月份批次:输入12,450个token,输出3,200个token,总计$0.47

查看所有最近的基准测试

agent-learner benchmark

跨所有日志搜索特定术语

agent-learner search 准确率

将所有数据导出为JSON

agent-learner export json

查看汇总统计

agent-learner stats

显示最近活动

agent-learner recent

输出

所有命令将输出返回到stdout。导出文件写入数据目录:

bash
agent-learner export json # → ~/.local/share/agent-learner/export.json
agent-learner export csv # → ~/.local/share/agent-learner/export.csv
agent-learner export txt # → ~/.local/share/agent-learner/export.txt

每个命令的执行都会被记录到$DATA_DIR/history.log中,用于审计目的。



由BytesAgain提供 | bytesagain.com | hello@bytesagain.com

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 agent-learner-1776159915 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 agent-learner-1776159915 技能

通过命令行安装

skillhub install agent-learner-1776159915

下载

⬇ 下载 agent-learner v2.0.2(免费)

文件大小: 4.86 KB | 发布时间: 2026-4-15 10:34

v2.0.2 最新 2026-4-15 10:34
update

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部