返回顶部
s

skill-creator-pro技能创造专家

Create new skills, modify and improve existing skills, and measure skill performance with eval-driven iteration. Use when users want to create a skill from scratch, edit or optimize an existing skill, run evals to test a skill, benchmark skill performance with variance analysis, or optimize a skill's description for better triggering accuracy. Also use when someone says 'turn this into a skill', 'make a skill for X', 'improve this skill', 'test this skill', 'run evals on this skill', or mentions

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.0.0
安全检测
已通过
691
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

skill-creator-pro

技能创建者

OpenClaw适配说明

本技能改编自Anthropic官方技能创建者 适用于OpenClaw运行时。与Claude Code的主要区别: 子代理生成:使用mode: run模式的sessions_spawn替代Claude Code的 原生子代理系统。示例:

sessions_spawn(task=使用<路径>处的技能执行此任务...,
mode=run, runTimeoutSeconds=300)

描述优化(claude -p):runloop.py和runeval.py脚本
会调用claude -p(Claude Code CLI)。如果主机上安装了Claude Code,它们
可直接运行。否则,通过sessions_spawn手动测试触发短语,或跳过自动
描述优化。
评估查看器(无头模式):OpenClaw通常以无头模式运行。始终使用--static:
bash
python eval-viewer/generate_review.py /iteration-N \
--skill-name my-skill \
--benchmark /iteration-N/benchmark.json \
--static /tmp/skill-review.html

然后通过message(action=send, filePath=...)将HTML文件发送给用户。
Claude.ai / Cowork部分:本文件底部的这些部分适用于
Claude.ai和Cowork环境。OpenClaw用户应遵循上述适配说明中的主要工作流程。

一个用于创建新技能并迭代改进的技能。

在高层面上,创建技能的过程如下:

  • - 确定你希望技能做什么以及大致如何实现
  • 编写技能草稿
  • 创建几个测试提示词,并在这些提示词上运行可访问该技能的Claude
  • 帮助用户定性和定量评估结果
- 在后台运行的同时,如果还没有定量评估,则起草一些定量评估(如果有,你可以直接使用或根据需要进行修改)。然后向用户解释它们(或者如果已存在,解释已有的评估) - 使用eval-viewer/generate_review.py脚本向用户展示结果供其查看,并让他们查看定量指标
  • - 根据用户对结果的评估反馈重写技能(如果定量基准中暴露出明显缺陷,也需修改)
  • 重复直到满意为止
  • 扩展测试集,在更大规模上再次尝试

使用此技能时,你的工作是确定用户处于此过程的哪个阶段,然后介入并帮助他们推进这些阶段。例如,用户可能说我想为X创建一个技能。你可以帮助他们明确具体需求,编写草稿,编写测试用例,确定他们想要如何评估,运行所有提示词,然后重复。

另一方面,用户可能已经有了技能草稿。在这种情况下,你可以直接进入评估/迭代循环部分。

当然,你应该始终保持灵活,如果用户说我不需要运行一堆评估,就跟我一起感受一下,你也可以这样做。

技能完成后(但同样,顺序是灵活的),你还可以运行技能描述优化器(我们有一个单独的脚本),以优化技能的触发。

明白了吗?很好。

与用户沟通

技能创建者可能会被各种对编程术语熟悉程度不同的人使用。如果你还没听说过(但你怎么可能听说过,这只是最近才开始的事情),现在有一个趋势,Claude的强大功能正在激励水管工打开他们的终端,父母和祖父母去谷歌搜索如何安装npm。另一方面,大多数用户可能对计算机相当熟悉。

所以请注意上下文线索,以理解如何措辞你的沟通!在默认情况下,给你一些参考:

  • - 评估和基准处于临界状态,但可以使用
  • 对于JSON和断言,你需要看到用户明确知道这些是什么的线索,才能在不解释的情况下使用

如果你不确定,简要解释术语是可以的,如果你不确定用户是否能理解,可以随时用简短的定义澄清术语。



创建技能

捕捉意图

首先理解用户的意图。当前对话可能已经包含用户想要捕捉的工作流程(例如,他们说把这个变成技能)。如果是这样,首先从对话历史中提取答案——使用的工具、步骤顺序、用户做出的修正、观察到的输入/输出格式。用户可能需要填补空白,并在进入下一步之前确认。

  1. 1. 这个技能应该让Claude能够做什么?
  2. 这个技能应该在什么时候触发?(什么用户短语/上下文)
  3. 预期的输出格式是什么?
  4. 我们是否应该设置测试用例来验证技能是否有效?具有客观可验证输出(文件转换、数据提取、代码生成、固定工作流程步骤)的技能受益于测试用例。具有主观输出(写作风格、艺术)的技能通常不需要。根据技能类型建议适当的默认值,但让用户决定。

访谈与研究

主动询问关于边界情况、输入/输出格式、示例文件、成功标准和依赖关系的问题。在解决这部分问题之前,等待编写测试提示词。

检查可用的MCP——如果对研究有用(搜索文档、查找类似技能、查找最佳实践),如果可用,通过子代理并行研究,否则内联进行。准备好上下文以减少用户负担。

编写SKILL.md

根据用户访谈,填写以下组件:

  • - name:技能标识符
  • description:何时触发,做什么。这是主要的触发机制——包括技能做什么以及何时使用的具体上下文。所有何时使用的信息都放在这里,而不是正文中。注意:目前Claude有触发不足的倾向——在有用时不使用技能。为了解决这个问题,请让技能描述稍微强势一些。例如,不要写如何构建一个简单的快速仪表板来显示内部Anthropic数据。,而是写如何构建一个简单的快速仪表板来显示内部Anthropic数据。确保每当用户提到仪表板、数据可视化、内部指标,或想要显示任何类型的公司数据时,即使他们没有明确要求仪表板,也要使用此技能。
  • compatibility:所需的工具、依赖关系(可选,很少需要)
  • 技能的其余部分 :)

技能编写指南

技能结构

skill-name/
├── SKILL.md (必需)
│ ├── YAML前置元数据(name、description必需)
│ └── Markdown指令
└── 捆绑资源(可选)
├── scripts/ - 用于确定性/重复性任务的可执行代码
├── references/ - 根据需要加载到上下文中的文档
└── assets/ - 输出中使用的文件(模板、图标、字体)

渐进式披露

技能使用三级加载系统:

  1. 1. 元数据(name + description)——始终在上下文中(约100词)
  2. SKILL.md正文——技能触发时在上下文中(理想情况下<500行)
  3. 捆绑资源——根据需要(无限制,脚本可以在不加载的情况下执行)

这些字数是大致的,如果需要,你可以自由地写得更长。

关键模式:

  • - 保持SKILL.md在500行以下;如果接近此限制,添加额外的层级结构,并明确指示使用该技能的模型下一步应该去哪里跟进
  • 从SKILL.md中清晰地引用文件,并指导何时阅读它们
  • 对于大型参考文件(>300行),包含目录

领域组织:当技能支持多个领域/框架时,按变体组织:

cloud-deploy/
├── SKILL.md(工作流程+选择)
└── references/
├── aws.md
├── gcp.md
└── azure.md

Claude只读取相关的参考文件。

无意外原则

这不用说,但技能不得包含恶意软件、利用代码或任何可能危及系统安全的内容。技能的内容不应在描述其意图时让用户感到意外。不要配合创建误导性技能或旨在促进未经授权访问、数据泄露或其他恶意活动的技能。像角色扮演为XYZ这样的内容是可以的。

编写模式

在指令中优先使用祈使句。

定义输出格式 - 你可以这样做:
markdown

报告结构


始终使用此确切模板:

[标题]


执行摘要


主要发现


建议

示例模式 - 包含示例很有用。你可以这样格式化它们(但如果示例中有输入和输出,你可能想稍微偏离一下):
markdown

提交消息格式


示例1:
输入:使用JWT令牌添加用户身份验证
输出:feat(auth): implement JWT-based authentication

写作风格

尝试向模型解释为什么事情很重要,而不是使用强硬的大写MUST。使用心智理论,尝试使技能通用化,而不是过于狭窄地针对特定示例。首先编写草稿,然后以全新的眼光查看并改进它。

测试用例

编写技能草稿后,提出2-3个真实的测试提示词——真实用户可能会说的那种话。与用户分享:[你不必使用这种确切的语言]这里有几个我想尝试的测试用例。这些看起来对吗,或者你想添加更多?然后运行它们。

将测试用例保存到evals/evals.json。暂时不要编写断言——只写提示词。你将在下一步中,在运行进行时起草断言。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 skill-creator-pro-1776153015 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 skill-creator-pro-1776153015 技能

通过命令行安装

skillhub install skill-creator-pro-1776153015

下载

⬇ 下载 skill-creator-pro v2.0.0(免费)

文件大小: 72.47 KB | 发布时间: 2026-4-15 10:29

v2.0.0 最新 2026-4-15 10:29
Complete rewrite: now based on Anthropic official skill-creator (github.com/anthropics/skills). Adds eval-driven iteration loop, browser-based viewer, grading system, blind A/B comparison, description optimization, benchmark aggregation. Adapted for OpenClaw with sessions_spawn, headless --static viewer, and claude -p compatibility notes.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部