返回顶部
e

experiment-designer实验设计器

Use when planning product experiments, writing testable hypotheses, estimating sample size, prioritizing tests, or interpreting A/B outcomes with practical statistical rigor.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.1.1
安全检测
已通过
500
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

experiment-designer

实验设计器

设计、优先排序并评估产品实验,提出清晰的假设并做出可辩护的决策。

使用场景

在以下情况下使用此技能:

  • - A/B测试及多变量实验规划
  • 假设撰写与成功标准定义
  • 样本量及最小可检测效应规划
  • 使用ICE评分进行实验优先级排序
  • 解读统计数据以支持产品决策

核心工作流程

  1. 1. 以如果/那么/因为格式撰写假设
- 如果我们改变[干预措施] - 那么[指标]将变化[预期方向/幅度] - 因为[行为机制]
  1. 2. 在测试前定义指标
- 主要指标:单一决策指标 - 护栏指标:质量/风险保护 - 次要指标:仅用于诊断
  1. 3. 估算样本量
- 基准转化率或基准均值 - 最小可检测效应(MDE) - 显著性水平(alpha)和统计功效

使用:
bash
python3 scripts/samplesizecalculator.py --baseline-rate 0.12 --mde 0.02 --mde-type absolute

  1. 4. 使用ICE对实验进行优先级排序
- 影响:潜在收益 - 置信度:证据质量 - 易实施性:成本/速度/复杂度

ICE分数 = (影响 × 置信度 × 易实施性) / 10

  1. 5. 设定停止规则后启动
- 提前决定固定样本量或固定时长 - 避免无适当方法的重复窥探 - 持续监控护栏指标
  1. 6. 解读结果
- 统计显著性不等于业务显著性 - 将点估计值+置信区间与决策阈值进行比较 - 调查新奇效应和细分异质性

假设质量检查清单

  • - [ ] 包含明确的干预措施和受众
  • [ ] 指定可衡量的指标变化
  • [ ] 陈述合理的因果理由
  • [ ] 包含预期的最小效应
  • [ ] 定义失败条件

常见实验陷阱

  • - 统计功效不足导致假阴性
  • 同时运行过多变更而未进行隔离
  • 在测试中途更改目标受众或实施方案
  • 因随机波动而过早停止实验
  • 忽略样本比例不匹配和测量工具漂移
  • 仅凭p值宣布成功而不考虑效应量背景

统计解读护栏

  • - p值小于alpha表示存在反对零假设的证据,而非绝对真理
  • 置信区间跨越零/无效应意味着方向性结论不确定
  • 即使具有统计显著性,宽置信区间也意味着精度较低
  • 使用与业务影响相关的实际显著性阈值

参见:

  • - references/experiment-playbook.md
  • references/statistics-reference.md

工具

scripts/samplesizecalculator.py

根据以下参数计算所需样本量(每个变体及总计):

  • - 基准转化率
  • 最小可检测效应(绝对或相对)
  • 显著性水平(alpha)
  • 统计功效

示例:
bash
python3 scripts/samplesizecalculator.py \
--baseline-rate 0.10 \
--mde 0.015 \
--mde-type absolute \
--alpha 0.05 \
--power 0.8

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 experiment-designer-1776127279 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 experiment-designer-1776127279 技能

通过命令行安装

skillhub install experiment-designer-1776127279

下载

⬇ 下载 experiment-designer v2.1.1(免费)

文件大小: 5.49 KB | 发布时间: 2026-4-15 12:39

v2.1.1 最新 2026-4-15 12:39
v2.1.1: optimization, reference splits

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部