返回顶部
p

prompt-ab-lab提示实验设计

Design, log, compare, and score prompt experiments so users can systematically

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
213
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

prompt-ab-lab

Prompt A/B 实验室

目的

设计、记录、比较和评分提示词实验,使用户能够系统性地优化输出结果,而非盲目猜测。

触发短语

  • - 比较两个提示词
  • prompt ab test
  • 提示词实验
  • 哪个 prompt 更好
  • 建一个评测表

需要用户提供以下信息

  • - 提示词 A 和 B
  • 任务
  • 评估标准
  • 测试集
  • 权重(如有)

工作流程

  1. 1. 在比较提示词之前,先定义成功的标准。
  2. 生成评估量表和结构化测试表格。
  3. 记录每个测试用例的输出结果,并计算加权得分。
  4. 总结权衡因素,避免过早判定胜负。
  5. 推荐下一轮实验的迭代方向。

输出约定

  • - 实验计划
  • 评分对比表
  • 评估量表
  • 下一轮迭代建议

本技能包含的文件

  • - 脚本:{baseDir}/scripts/promptexperimentlogger.py
  • 资源文件:{baseDir}/resources/eval_rubric.md

操作规则

  • - 保持具体且以行动为导向。
  • 在执行破坏性更改前,优先使用预览/草稿/模拟模式。
  • 若信息缺失,仅询问推进所需的最少信息。
  • 绝不编造指标、法律确定性、收据、凭证或证据。
  • 明确说明所有假设。

建议的提示词

  • - 比较两个提示词
  • prompt ab test
  • 提示词实验

脚本与资源的使用

当脚本有助于用户生成结构化文件、清单、CSV 或初稿时,使用捆绑脚本。
当用户未提供默认模式、检查清单或预设时,使用资源文件作为默认方案。

边界说明

  • - 本技能支持规划、结构化和初稿生成。
  • 除非用户实际执行了相关操作,否则不得声称文件已被修改、消息已发送或法律/财务决策已最终确定。

兼容性说明

  • - 基于目录的 AgentSkills/OpenClaw 技能。
  • 运行时依赖通过 metadata.openclaw.requires 声明。
  • 辅助脚本为本地可审计文件:scripts/promptexperimentlogger.py。
  • 捆绑资源为本地文件,由指令引用:resources/eval_rubric.md。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 prompt-ab-lab-1776111472 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 prompt-ab-lab-1776111472 技能

通过命令行安装

skillhub install prompt-ab-lab-1776111472

下载

⬇ 下载 prompt-ab-lab v1.0.0(免费)

文件大小: 7.28 KB | 发布时间: 2026-4-15 14:01

v1.0.0 最新 2026-4-15 14:01
New version adds systematic prompt experiment design and logging features.

- Enables users to design, log, compare, and score prompt A/B experiments.
- Provides evaluation rubrics, structured test tables, and weighted scoring.
- Summarizes tradeoffs and suggests next steps rather than declaring outright winners.
- Includes clear workflow, operating rules, and usage boundaries for safer, action-oriented experimentation.
- Bundles a helper script and resource file to assist with experiment setup and evaluation.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部