返回顶部
d

discovery-engine自动发现引擎

Automatically discover novel, statistically validated patterns in tabular data. Find insights you'd otherwise miss, far faster and cheaper than doing it yourself (or prompting an agent to do it). Disco systematically searches for feature interactions, subgroup effects, and conditional relationships you wouldn't think to look for, validates each on hold-out data with FDR-corrected p-values, and checks every finding against academic literature for novelty. Returns structured patterns with conditio

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.2.102
安全检测
已通过
453
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

discovery-engine

Disco

集成选项

  • - MCP 服务器 — 远程服务器位于 https://disco.leap-labs.com/mcp,无需安装。最适合处理 URL 上的数据集。
  • Python SDK — pip install discovery-engine-api。用于处理任意大小的本地文件。 在您的机器上运行并直接流式传输文件 — 无需 base64,无大小限制。

快速规则: 如果数据位于 URL,则在 discoveryupload 中使用 fileurl。如果是本地文件,请使用 Python SDK — 或者如果 Python 不可用,则通过预签名 API 直接上传,并将结果传递给 discoveryanalyze。除非文件已加载到内存中且非常小,否则不要使用 filecontent(base64)。



MCP 服务器

添加到您的 MCP 配置:

json
{
mcpServers: {
discovery-engine: {
url: https://disco.leap-labs.com/mcp,
env: { DISCOVERYAPIKEY: disco_... }
}
}
}

MCP 工具

Discovery 工作流

工具用途
discoveryupload上传数据集。支持 URL 下载(fileurl)、本地路径(filepath)或 base64 内容(filecontent)。返回一个 fileref,用于 discoveryanalyze。
discoveryanalyze
使用 discoveryupload 返回的 fileref 提交数据集进行分析。返回一个 runid。 | | discoverystatus | 通过 runid 轮询正在运行的分析。 | | discoverygetresults | 获取已完成的结果:模式、p 值、引用、特征重要性。 | | discovery_estimate | 在提交运行前估算信用点成本。 |

账户管理

工具用途
discoverysignup开始创建账户 — 向邮箱发送验证码。
discoverysignup_verify
通过提交验证码完成注册。返回 API 密钥。 | | discovery_login | 为现有账户获取新的 API 密钥 — 向邮箱发送验证码。 | | discoveryloginverify | 通过提交验证码完成登录。返回新的 API 密钥。 | | discovery_account | 查看信用点、套餐和使用情况。 | | discoverylistplans | 查看可用套餐和定价。 | | discovery_subscribe | 订阅或更改套餐。 | | discoverypurchasecredits | 购买信用点包。 | | discoveryaddpayment_method | 添加 Stripe 支付方式。 |

MCP 工作流

分析需要 3–15 分钟。不要阻塞 — 提交后,继续其他工作,轮询完成状态。

  1. 1. discoveryestimate → 检查信用点成本(私有运行务必执行此步骤)
  2. discoveryupload → 上传数据集,获取 fileref
  3. discoveryanalyze → 使用 fileref 提交分析,获取 runid
  4. discovery_status → 轮询直到状态为 completed
返回:status, queueposition, currentstep, estimatedwaitseconds
  1. 5. discoverygetresults → 获取模式、摘要、特征重要性

数据导入

根据您的情况选择正确的路径:

情况最佳方法
数据位于 http/https URLdiscoveryupload 中的 fileurl
本地文件,Python 可用
Python SDK(engine.discover(...)) |
| 本地文件,MCP 服务器在本地运行 | discoveryupload 中的 filepath |
| 本地文件,托管 MCP,无 Python | 直接上传 API(3 个步骤 — 见下文) |
| 小文件,任何语言 | POST /api/data/upload/direct(单步 — 见下文) |
| 已加载到内存中的极小文件 | discoveryupload 中的 filecontent(最后手段) |


URL 上的数据:

discoveryupload(fileurl=https://example.com/dataset.csv)
→ {file: {...}, columns: [{name: col1, type: continuous, ...}], rowCount: 5000}

discoveryanalyze(fileref=<上述结果>, target_column=outcome)

服务器直接下载文件 — 不经过代理或模型上下文。适用于公共 URL、S3 预签名 URL 或任何可访问的 http/https 链接。



本地文件 — Python SDK(推荐用于任何本地文件):

python
from discovery import Engine

engine = Engine(apikey=disco...)
result = await engine.discover(data.csv, target_column=outcome)

一次调用处理上传、轮询和结果。无大小限制。完整文档请参阅 Python SDK 部分。



本地文件 — MCP 服务器在本地运行(从 GitHub 克隆,stdio 传输):

如果您已克隆仓库并在本地运行 server.py,该进程可以直接读取您的文件系统:

discoveryupload(filepath=/home/user/data/dataset.csv)
→ {file: {...}, columns: [...], rowCount: 5000}

discoveryanalyze(fileref=<上述结果>, target_column=outcome)

在本地读取文件并直接流式传输到云存储 — 不经过模型上下文。无大小限制。托管服务器 disco.leap-labs.com/mcp 会静默忽略 file_path — 它仅适用于本地运行的服务器。



本地文件 — 托管 MCP,直接上传(适用于任何语言):

如果您使用托管 MCP 服务器且 Python 不可用,可以通过 REST API 分三步直接上传,然后将结果正常传递给 discovery_analyze。

bash

1. 获取预签名上传 URL


curl -X POST https://disco.leap-labs.com/api/data/upload/presign \
-H Authorization: Bearer disco_... \
-H Content-Type: application/json \
-d {fileName: data.csv, contentType: text/csv, fileSize: 1048576}

→ {uploadUrl: https://storage.googleapis.com/..., key: uploads/abc/data.csv, uploadToken: tok_...}

2. 将文件直接 PUT 到云存储(uploadUrl 是预签名的 — 无需认证头)

curl -X PUT <步骤 1 中的 uploadUrl> \ -H Content-Type: text/csv \ --data-binary @data.csv

3. 完成上传

curl -X POST https://disco.leap-labs.com/api/data/upload/finalize \ -H Authorization: Bearer disco_... \ -H Content-Type: application/json \ -d {key: uploads/abc/data.csv, uploadToken: tok_...}

→ {ok: true, file: {...}, columns: [...], rowCount: 5000}

将 finalize 响应直接作为 fileref 传递给 discoveryanalyze。无大小限制。



小文件 — 直接上传(单次 HTTP 调用,比预签名更简单):

bash
curl -X POST https://disco.leap-labs.com/api/data/upload/direct \
-H Authorization: Bearer disco_... \
-H Content-Type: application/json \
-d {fileName: data.csv, content: }

→ {ok: true, file: {...}, columns: [...], rowCount: 5000}

将响应直接作为 fileref 传递给 discoveryanalyze。比 3 步预签名流程更简单,但整个文件必须适合请求体。对于大文件,请使用预签名上传或 Python SDK。



最后手段 — 已加载到内存中的极小文件:

仅当文件已加载到内存中且上述选项均不适用时使用。base64 编码的内容会经过模型的上下文窗口,因此仅适用于非常小的文件。

python
import base64
content = base64.b64encode(open(data.csv, rb).read()).decode()

discoveryupload(filecontent=content, file_name=data.csv)
→ {file: {...}, columns: [...], rowCount: 500}

discoveryanalyze(fileref=<上述结果>, target_column=outcome)



MCP 参数

discovery_upload:

仅提供 fileurl、filepath 或 file_content 中的一个。

  • - file_url — http/https URL。服务器直接下载。托管

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 discovery-engine-1776125593 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 discovery-engine-1776125593 技能

通过命令行安装

skillhub install discovery-engine-1776125593

下载

⬇ 下载 discovery-engine v0.2.102(免费)

文件大小: 64.72 KB | 发布时间: 2026-4-15 12:31

v0.2.102 最新 2026-4-15 12:31
Published from e4abe907666a49ec2290969f452435509141f68d

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部