返回顶部
d

datapulse数据脉冲

Cross-platform content collection, web search, trending topics, confidence scoring, and watch/triage workflows for assistant and agent usage.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.8.1
安全检测
已通过
291
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

datapulse

DataPulse 技能 (v0.8.1)

当用户需要以下一项或多项功能时,请使用此技能:

  • - 读取或批量读取 X、Reddit、YouTube、Bilibili、Telegram、微信、小红书、RSS、arXiv、Hacker News、GitHub 以及通用网页的 URL
  • 搜索网络、查看热门话题或收集跨平台信号
  • 创建监控任务、警报路由、分类队列或故事证据包
  • 通过 datapulse_skill.run() 运行助手就绪的 URL 接收

Python 入口点

python
from datapulse_skill import run

run(请处理这些链接: https://x.com/... https://www.reddit.com/...)

核心能力

  • - URL 接收,输出标准化的 DataPulseItem
  • 置信度评分与排序
  • 网络搜索与热门发现
  • 监控任务与警报路由
  • 分类队列与故事工作区工作流

行为说明

浏览器自动化(可选)

DataPulse 使用 Playwright 处理需要认证浏览器会话的平台(微信、小红书)。浏览器自动化仅为选择加入——只有当用户明确运行 login 命令且存在有效会话文件时才会激活。playwright 依赖项是可选的(pip install datapulse[browser])。正常 URL 读取期间不会启动浏览器。

子进程调用

  • - MCP 传输:故事和分类模块调用 subprocess.run() 通过 subprocess_json 传输(stdin/stdout JSON-RPC)与 MCP 工具服务器通信。所有调用都有明确的超时时间(默认 30 秒)。
  • YouTube 回退:当原生 API 不可用时,YouTube 收集器可能调用 yt-dlp 作为子进程进行音频转录提取。
  • CLI 更新检查:CLI 仅在用户明确运行 --upgrade 时调用 pip install --upgrade。

没有子进程调用会在未经用户发起操作的情况下静默运行。

本地持久化

  • - 会话文件:Playwright 登录会话保存到 ~/.datapulse/sessions/ 以便重用。会话具有 TTL 缓存(12 小时),可通过 invalidatesessioncache() 使其失效。
  • 数据文件:监控任务、警报路由、分类队列、故事工作区和实体存储以 JSON 文件形式持久化在工作目录下(data/ 文件夹)。所有写入均使用原子保存模式。

未经用户明确操作,不会在工作目录或 ~/.datapulse/ 之外写入数据。

出站 HTTP(警报投递)

当用户配置警报路由时,DataPulse 向用户指定的端点发送 POST 请求:

  • - Webhook:用户提供的任意 URL
  • 飞书:用户提供的飞书机器人 webhook URL
  • Telegram:使用用户提供的机器人令牌的 Telegram Bot API(api.telegram.org)

警报投递仅在以下情况下触发:(1)监控任务匹配到新内容,且(2)用户已明确配置包含目标 URL 或令牌的路由。没有用户配置的路由,不会发生出站 POST 请求。

本地服务器(可选)

datapulse-console 启动一个本地 FastAPI/Uvicorn HTTP 服务器,用于基于浏览器的控制台 UI。它默认绑定到 localhost,并且永远不会自动启动——只有当用户明确运行 datapulse-console 或 python -m datapulse.console_server 时才会启动。

外部 API 调用(只读)

正常操作会向以下地址发出出站 GET/POST 请求:

  • - Jina AI(r.jina.ai、s.jina.ai):URL 读取和网络搜索(需要 JINAAPIKEY)
  • Tavily(api.tavily.com):网络搜索(需要 TAVILYAPIKEY)
  • Groq(api.groq.com):YouTube 音频转录回退(需要 GROQAPIKEY)
  • 目标 URL:用户要求读取的 URL

所有 API 密钥均从环境变量读取;没有捆绑或硬编码的密钥。

环境说明

  • - Python 3.10+
  • 可选搜索增强:JINAAPIKEY、TAVILYAPIKEY
  • 可选平台增强:TGAPIID、TGAPIHASH、GROQAPIKEY
  • 可选浏览器会话:pip install datapulse[browser](Playwright)
  • 可选控制台 UI:pip install datapulse[console](FastAPI + Uvicorn)

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 datapulse-1776184239 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 datapulse-1776184239 技能

通过命令行安装

skillhub install datapulse-1776184239

下载

⬇ 下载 datapulse v0.8.1(免费)

文件大小: 278.54 KB | 发布时间: 2026-4-15 10:31

v0.8.1 最新 2026-4-15 10:31
v0.8.1 — Security transparency

Added full behavior disclosure to SKILL.md to address OpenClaw security scan findings:

- Documented opt-in Playwright browser automation (WeChat/XHS login sessions)
- Disclosed subprocess usage (MCP JSON-RPC transport, yt-dlp fallback, CLI upgrade) with explicit timeouts
- Clarified local persistence scope (~/.datapulse/sessions/ and data/ only)
- Declared outbound webhook/Feishu/Telegram alert delivery as user-configured-only
- Noted local FastAPI console server is never auto-started
- Listed all external API endpoints (Jina, Tavily, Groq) as read-only, key-from-env
- Extended manifest capabilities with 6 new behavior declarations

No functional changes. Code is identical to v0.8.0.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部