返回顶部
d

data-spider数据爬虫

Scrape any webpage and extract structured data as JSON, table, or list. Supports schema-guided extraction.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.0
安全检测
已通过
521
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

data-spider

Data Spider

从任意网页抓取并提取结构化数据。支持通过模式引导提取以匹配特定数据形状,或自动检测数据结构。根据所选格式,返回JSON对象、表格(列+行)或扁平列表形式的数据。

使用场景

  • - 从页面提取产品信息或定价
  • 收集文章中的统计数据和数字
  • 从网络来源构建数据集
  • 通过模式引导提取以匹配数据模型
  • 研究与竞品分析

使用流程

  1. 1. 提供网页url
  2. 可选提供schema对象——数据将被提取以匹配该精确形状
  3. 可选设置format:json(默认)、table或list
  4. AIProx路由至data-spider代理
  5. 以请求格式返回结构化数据,附带摘要和来源URL

安全声明

权限范围原因
网络aiprox.dev编排端点的API调用
环境读取
AIPROXSPENDTOKEN | 付费API的身份验证 |

发起请求——带模式的JSON

bash
curl -X POST https://aiprox.dev/api/orchestrate \
-H Content-Type: application/json \
-H X-Spend-Token: $AIPROXSPENDTOKEN \
-d {
url: https://example.com/pricing,
schema: {freetier: null, proprice: null, enterprise: null},
format: json
}

响应——JSON

json
{
data: {freetier: $0/月,1000次API调用, proprice: $29/月, enterprise: 自定义定价},
summary: 包含三个层级的SaaS定价页面。,
source: https://example.com/pricing,
format: json
}

发起请求——表格

bash
curl -X POST https://aiprox.dev/api/orchestrate \
-H Content-Type: application/json \
-H X-Spend-Token: $AIPROXSPENDTOKEN \
-d {
task: 以表格形式提取定价层级,
url: https://example.com/pricing,
format: table
}

响应——表格

json
{
columns: [方案, 价格, API调用次数],
rows: [
[免费版, $0/月, 1,000],
[专业版, $29/月, 50,000],
[企业版, 自定义, 无限制]
],
summary: 三层SaaS定价。,
source: https://example.com/pricing,
format: table
}

响应——列表

json
{
items: [$0/月 — 免费版,1000次API调用, $29/月 — 专业版,50,000次调用, 企业版 — 自定义定价],
summary: 以扁平列表形式提取的SaaS定价层级。,
source: https://example.com/pricing,
format: list
}

信任声明

Data Spider通过URL获取并分析网页内容。内容被临时处理且不存储。分析由Claude通过LightningProx执行。遵守robots.txt和速率限制。您的消费令牌仅用于支付。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 data-spider-1776162675 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 data-spider-1776162675 技能

通过命令行安装

skillhub install data-spider-1776162675

下载

⬇ 下载 data-spider v1.1.0(免费)

文件大小: 1.91 KB | 发布时间: 2026-4-15 11:56

v1.1.0 最新 2026-4-15 11:56
Now supports model selection — specify any of 19 models across 5 providers per request (e.g. gemini-2.5-flash, mistral-large-latest, claude-opus-4-5-20251101)

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部