返回顶部
a

autoresearch自动研究

Autonomous goal-directed iteration for optimization and improvement tasks. Use when you need to systematically improve a metric, optimize a system, or iteratively refine something. Triggers on phrases like 'autoresearch', 'autonomous loop', 'iterate until', 'improve X', 'optimize Y', or when user wants to run multiple iterations of make-change → verify → keep/revert cycles.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
87
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

autoresearch

自动研究技能

运行自主迭代循环:目标 → 指标 → 循环(做出变更 → 验证 → 保留/回滚 → 重复)

核心协议

设置:

  1. 1. 定义目标(要改进什么)
  2. 定义指标(如何衡量成功)
  3. 定义范围(可以修改什么)
  4. 建立基线(当前指标值)

循环(无限次或N次迭代):

  1. 1. 审查当前状态 + 历史记录 + 结果日志
  2. 选择下一个变更(基于哪些有效、哪些失败、哪些未尝试)
  3. 做一个聚焦的变更
  4. 提交变更(用于回滚)
  5. 运行机械验证(测试、基准测试、评分)
  6. 如果改进 → 保留。如果更差 → 回滚。如果出错 → 修复或跳过。
  7. 记录结果
  8. 重复直到达成目标或达到最大迭代次数

原则

  1. 1. 每次迭代一个变更 — 原子性变更。如果出错,你知道原因。
  2. 仅机械验证 — 没有主观的看起来不错。使用指标。
  3. 自动回滚 — 失败的变更立即回滚。
  4. Git是记忆 — 每个实验都被提交。Git回滚保留历史。
  5. 简洁胜出 — 相同结果 + 更少代码 = 保留

快速开始

目标:将内存搜索Top-1命中率从65%提升到75%
指标:基准测试分数(openclaw cron runs --id --limit 1)
范围:~/.openclaw/workspace/MEMORY.md, ~/.openclaw/openclaw.json
最大迭代次数:5

然后手动运行循环或生成子代理来执行。

使用模式

模式1:手动循环(交互式)

对于简单任务,自行运行循环:

迭代1:
- 变更:[描述你将更改的内容]
- 验证:[运行验证]
- 结果:[保留/回滚 + 原因]
- 日志条目

模式2:生成子代理(自主式)

对于较长的任务,使用循环指令生成子代理:

sessions_spawn 使用:
- 任务:完整的自动研究循环规范
- timeoutSeconds:600(每次迭代10分钟)
- 模式:run(一次性)或 session(持久化)

模式3:后台进程

对于非常长的循环,使用带后台延续的exec:

exec 使用:
- 命令:优化脚本
- 后台:true
- yieldMs:60000(每分钟检查一次)

验证命令

领域验证命令
内存搜索openclaw cron runs --id <job-id> --limit 1
测试
npm test, pytest, cargo test | | 构建 | npm run build, cargo build | | 代码检查 | eslint ., ruff check . | | 基准测试 | npm run bench, 自定义基准测试脚本 | | 覆盖率 | npm test -- --coverage |

日志格式

以TSV格式跟踪迭代:

迭代 变更 指标之前 指标之后 增量 状态 描述
0 基线 65.0 65.0 0.0 基线 初始状态
1 降低minScore 65.0 70.0 +5.0 保留 检索改进
2 尝试更大模型 70.0 68.0 -2.0 回滚 更差,已回滚
3 添加语料条目 70.0 72.0 +2.0 保留 填补空白

子代理模板

在生成用于自动研究的子代理时,使用此模板:

markdown
目标:[要改进什么]
指标:[如何衡量]
验证:[要运行的命令]
范围:[可以修改的文件]
最大迭代次数:[数字]

约束:

  • - [资源限制]
  • [安全规则]
  • [可逆性要求]

方法:

  1. 1. 建立基线
  2. 对于每次迭代:

a. 确定下一个变更
b. 做一个原子性变更
c. 运行验证
d. 与基线比较
e. 如果改进则保留,如果更差则回滚
f. 记录结果
  1. 3. 报告最终结果

常见模式

改进基准测试分数

目标:改进基准测试分数
指标:基准测试输出
变更:配置调整、语料改进、模型变更
迭代次数:5-10

修复测试

目标:所有测试通过
指标:失败的测试数量
变更:一次修复一个测试
迭代次数:直到零失败

减少打包大小

目标:打包小于100KB
指标:构建输出大小
变更:移除依赖、摇树优化、压缩
迭代次数:直到达成目标

提高覆盖率

目标:覆盖率大于80%
指标:覆盖率百分比
变更:为未覆盖的代码行添加测试
迭代次数:直到达成目标

失败处理

失败类型响应
语法错误立即修复,不计入迭代次数
运行时错误
尝试修复(最多3次),然后继续 | | 资源耗尽 | 回滚,尝试更小的变体 | | 超时 | 回滚,简化方法 | | 外部依赖失败 | 跳过,记录,尝试不同方法 |

停止条件

  • - 达成目标指标
  • 达到最大迭代次数
  • 连续3次迭代无改进
  • 用户中断(Ctrl+C或/stop)

参考

关于高级模式,请参见:

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 fanta-autoresearch-1776062300 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 fanta-autoresearch-1776062300 技能

通过命令行安装

skillhub install fanta-autoresearch-1776062300

下载

⬇ 下载 autoresearch v1.0.0(免费)

文件大小: 9.16 KB | 发布时间: 2026-4-14 10:35

v1.0.0 最新 2026-4-14 10:35
Initial release. Provides autonomous iteration loops for optimization tasks: Goal → Metric → Loop (make change → verify → keep/revert → repeat). Includes workflow patterns, metric references, and interactive loop executor script.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部