返回顶部
e

evaluate-agent-native评估原生代理

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.4.0
安全检测
已通过
223
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

evaluate-agent-native

技能:evaluate-agent-native

使用此技能,根据五项标准严格评估某项服务是否符合原生代理资格。同时检查 URL 接入信号——这是判断某项服务是否真正从第一天起为代理构建的最强指标。

黄金标准:URL 接入

在应用五项标准之前,先提出最高层级的问题:

代理能否通过读取单个 URL 加入并开始使用该服务?

回答是的服务展现了最强形式的代理原生性。它们已将代理视为一等用户,以至于接入流程本身都是机器可读的:

一条指令即可完成完整的代理接入:

读取 并按照说明操作。

示例:

  • - Moltbook:读取 https://www.moltbook.com/skill.md — 完整的注册、心跳、发布、DM 协议
  • Ensue / autoresearch@home:读取 https://raw.githubusercontent.com/mutable-state-inc/autoresearch-at-home/master/collab.md — 完整的群组加入、认领、发布协议

这与以下情况有本质区别:

  • - 需要人类开发者安装的 SDK(需要人类编码时间)
  • 需要人类添加到配置文件中的 MCP 服务器(需要人类配置编辑)
  • 需要设置 API 密钥的 REST API(需要人类创建账户)

URL 接入意味着代理本身处理所有这些——自主读取、理解并执行加入流程。

将 URL 接入标记为强加分信号,并在评估报告中突出显示。



何时激活

当用户询问以下问题时激活:

  • - [服务]是原生代理吗?
  • [服务]是否符合 awesome 列表的资格?
  • 我想添加[服务]——它符合标准吗?
  • 原生代理和适配代理有什么区别?
  • 为什么[服务]不在列表中?
  • [服务]有 URL 接入吗?



五项硬性标准

一项服务必须全部通过才能被认定为原生代理。逐项明确评估。

标准 1 — 代理优先定位

测试: 官方首页或文档是否明确将 AI 代理标识为主要消费者

需要寻找的证据:

  • - 首页标题提及 AI 代理
  • 文档将代理定位为核心用户
  • 产品名称或标语仅对代理有意义

警示信号:

  • - 现已支持 AI 代理(代理是附加功能)
  • 构建应用、工作流和代理(代理是众多输出之一)

标准 2 — 代理专用原语

测试: API 是否至少暴露一个没有有意义的人类对应物的原语?

需要问的问题:

  • - 核心 API 对象是什么?代理收件箱?KYA 令牌?认领?心跳?还是通用收件箱/令牌/任务?
  • 如果代理不存在,这个原语还会存在吗?
  • 输出格式是针对 LLM 消费优化还是人类阅读优化?

通过示例: 代理收件箱、KYA 身份令牌、带上下文窗口注入的审批门、claimexperiment()、心跳协议、publishhypothesis()。

失败示例: 发送电子邮件的 REST API(人类也使用)、任何服务器都能接收的 webhook。

标准 3 — 自主兼容控制平面

测试: 代理能否无需人类点击任何内容完成完整的任务循环?

需要问的问题:

  • - 代理能否自行配置凭证?
  • 代理能否在没有人类重定向的情况下发起、执行并完成操作?
  • 服务是否提供适合代理的约束机制?

标准 4 — 机器对机器集成面

测试: 主要接口是否是 SDK、REST API、MCP 服务器、webhook 或机器可读 URL

需要问的问题:

  • - 代理能否在不打开浏览器的情况下使用此服务?
  • 是否有记录为主要集成路径的 URL、SDK、REST API 或 MCP 服务器?

注意: 暴露机器可读的 skill.md 或协议 URL(URL 接入)的服务以极强的力度通过此标准。

标准 5 — 代理身份/委托语义

测试: 服务是否区分 (a) 代理自身身份、(b) 委托的用户权限、(c) 审计追踪?



加分信号(勾选所有适用项)


信号权重需要寻找的证据
URL 接入 ⭐⭐⭐最高服务托管机器可读的 skill.md/协议文档,代理读取并遵循以自行注册
专用代理身份模型
高 | 代理获得自己的凭证/钱包/令牌 |
| 已发布 MCP 服务器 | 中 | 官方 MCP 服务器,带有文档化的工具 |
| 已发布代理技能(SKILL.md) | 中 | npx skills add org/repo 可工作 |
| 每代理状态/记忆/会话 | 中 | 按代理实例隔离的状态 |
| 审计/轨迹工件 | 中 | 代理操作的机器可读证据 |

如何测试 URL 接入:

  1. 1. 查找托管在服务域名或 GitHub 上的 skill.md、SKILL.md、collab.md 或类似的机器可读协议文件。
  2. 询问:代理能否读取该 URL 并自主完成完整的注册/接入流程?
  3. 尝试指令:读取 并按照说明操作——是否有效?



分类决策树

服务是否通过全部 5 项标准?
├── 是 → 原生代理 ✅
│ └── 是否也有 URL 接入?
│ ├── 是 → 原生代理 ⭐(URL 接入——最高层级)
│ └── 否 → 原生代理(标准)
└── 否
├── 最初为人类构建,后来添加了代理接口?
│ └── 是 → 适配代理 ⚠️
└── 帮助人类构建代理?
└── 是 → 代理构建器 ❌



评估输出格式

评估:{服务名称}

网站: {URL}

URL 接入检查 ⭐

是否有 URL 接入: 是 / 否 接入指令(如果是): 读取 {URL} 并按照说明 {加入/注册/参与} 备注: {代理通过读取该 URL 获得的内容}

标准 1 — 代理优先定位

结果: 通过 / 未通过 / 部分通过 证据: {精确引用} — {来源 URL}

标准 2 — 代理专用原语

结果: 通过 / 未通过 / 部分通过 证据: {原语名称和描述} 无人类对应物原因: {解释}

标准 3 — 自主兼容控制平面

结果: 通过 / 未通过 / 部分通过 证据: {代理如何无需人类确认即可操作}

标准 4 — 机器对机器集成面

结果: 通过 / 未通过 / 部分通过 证据: {URL、SDK、API、MCP 详情}

标准 5 — 代理身份/委托语义

结果: 通过 / 未通过 / 部分通过 / 不适用 证据: {身份模型详情}

加分信号

  • - [ ] URL 接入 ⭐⭐⭐ — 代理通过读取一个 URL 加入
  • [ ] 专用代理身份模型
  • [ ] 已发布 MCP 服务器
  • [ ] 已发布代理技能(SKILL.md)
  • [ ] 每代理状态/记忆/会话
  • [ ] 审计/轨迹/回放工件

总体判定

分类: 原生代理 ⭐(URL 接入)/ 原生代理 / 适配代理 / 代理构建器 建议: 添加到主列表 / 添加到排除部分 / 不添加 置信度: 高 / 中 / 低 理由: {一段总结}

后续步骤

{如果是带 URL 接入的原生代理:在 issue 和服务文件中突出显示} {如果是无 URL 接入的原生代理:链接到 issue 模板} {如果是适配代理:解释需要改变什么}

常见边界案例

产品添加了 MCP 服务器——这算原生代理吗?

不算。MCP 支持是加分信号,不是标准。核心问题是服务是否从设计之初就为代理构建。一个添加了 MCP 服务器的人类电子邮件提供商仍然是适配代理。

服务有 URL 接入但其他标准较弱。

URL 接入是最强的加分信号,但不能替代五项硬性标准。独立评估全部五项;URL 接入是放大器,不是替代品。

服务在营销中说面向 AI 代理。

检查实际的原语。URL 接入是可靠的信号,因为它需要真正的设计努力——你无法通过营销博客文章伪造它。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 evaluate-agent-native-1776078972 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 evaluate-agent-native-1776078972 技能

通过命令行安装

skillhub install evaluate-agent-native-1776078972

下载

⬇ 下载 evaluate-agent-native v1.4.0(免费)

文件大小: 4.2 KB | 发布时间: 2026-4-15 12:39

v1.4.0 最新 2026-4-15 12:39
v1.4.0: Star badges added to catalog. No criteria changes.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部