返回顶部
d

data-intelligence数据智能平台

综合数据智能平台 - 整合 Apify 云端爬虫、PinchTab 浏览器自动化、内容分析与数据工作流。支持 55+ 平台的网络爬虫、线索生成、电商情报、竞品分析、趋势研究,以及浏览器自动化测试和数据提取。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
292
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

data-intelligence

Data Intelligence 数据智能平台

综合数据智能解决方案,整合云端爬虫、浏览器自动化和内容分析,构建完整的数据采集与分析工作流。

系统架构

┌─────────────────────────────────────────────────────────────────┐
│ Data Intelligence 平台 │
├─────────────────┬─────────────────┬─────────────────────────────┤
│ 云端爬虫层 │ 浏览器自动化层 │ 内容分析层 │
├─────────────────┼─────────────────┼─────────────────────────────┤
│ • Apify Actors │ • PinchTab │ • 内容工厂 │
│ • 55+ 平台支持 │ • 多实例编排 │ • 趋势分析 │
│ • 无服务器架构 │ • Token高效提取 │ • 竞品监测 │
│ • 弹性扩展 │ • 自动化测试 │ • 数据可视化 │
└─────────────────┴─────────────────┴─────────────────────────────┘
│ │ │
└────────────────┼───────────────────┘

┌─────────────────────┐
│ 数据工作流引擎 │
│ • 数据采集 │
│ • 清洗转换 │
│ • 分析洞察 │
│ • 报告生成 │
└─────────────────────┘



一、云端爬虫层 (Apify)

1.1 支持的 55+ 平台

社交媒体 (45 Actors)

平台Actor 数量主要用途
Instagram12个人资料、帖子、评论、标签、Reels
Facebook
14 | 页面、帖子、评论、广告、群组、活动 | | TikTok | 14 | 视频、评论、用户、标签、趋势、直播 | | YouTube | 5 | 视频、频道、评论、Shorts |

商业与本地 (10 Actors)

平台Actor 数量主要用途
Google Maps4商家信息、评论、邮箱提取
Booking.com
2 | 酒店数据、评论 | | TripAdvisor | 1 | 评论分析 | | Google Search | 1 | 搜索结果 | | Google Trends | 1 | 趋势数据 |

1.2 核心 Actor 速查表

线索生成

需求Actor ID输出
本地商家compass/crawler-google-places名称、地址、电话、评分
邮箱提取
poidata/google-maps-email-extractor | 邮箱列表 | | 联系信息 | vdrmota/contact-info-scraper | 邮箱、电话、社交媒体 | | Instagram 用户 | apify/instagram-profile-scraper | 个人资料、粉丝数 | | TikTok 创作者 | clockworks/tiktok-profile-scraper | 创作者信息 |

内容分析

需求Actor ID输出
Instagram 帖子apify/instagram-post-scraper内容、点赞、评论数
TikTok 视频
clockworks/tiktok-scraper | 视频、播放量、分享数 | | YouTube 视频 | streamers/youtube-scraper | 标题、观看、点赞 | | Facebook 页面 | apify/facebook-pages-scraper | 页面信息、帖子 |

竞品监测

需求Actor ID输出
Google Maps 评论compass/Google-Maps-Reviews-Scraper评论、评分、情感
Booking 评论
voyager/booking-reviews-scraper | 住客评价 | | TripAdvisor | maxcopell/tripadvisor-reviews | 旅游评论 |

1.3 Apify 使用工作流

前置条件:
bash

1. 安装依赖


npm install -g @apify/mcpc

2. 配置 Token

echo APIFYTOKEN=yourtoken_here > .env

3. 验证

export $(grep APIFY_TOKEN .env | xargs) && mcpc --version

标准工作流:

markdown

数据采集任务清单

  • - [ ] 步骤 1: 明确目标 - 需要什么数据?从哪个平台?
  • [ ] 步骤 2: 选择 Actor - 根据平台速查表选择
  • [ ] 步骤 3: 获取 Schema - 了解输入参数
  • [ ] 步骤 4: 配置参数 - 设置搜索关键词、数量等
  • [ ] 步骤 5: 运行采集 - 执行 Actor
  • [ ] 步骤 6: 数据清洗 - 处理缺失值、格式转换
  • [ ] 步骤 7: 分析洞察 - 生成报告

执行命令:

bash

快速预览(仅显示结果,不保存文件)


export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com \
--header Authorization: Bearer $APIFY_TOKEN \
tools-call run-actor \
actor:=compass/crawler-google-places \
input:={searchStrings: [coffee shop], location: New York}

导出 CSV

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com \ --header Authorization: Bearer $APIFY_TOKEN \ tools-call run-actor \ actor:=compass/crawler-google-places \ input:={searchStrings: [coffee shop], maxCrawledPlaces: 50} \ | jq -r .content[0].text > results.csv

导出 JSON

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com \ --header Authorization: Bearer $APIFY_TOKEN \ tools-call run-actor \ actor:=apify/instagram-profile-scraper \ input:={usernames: [example_user]} \ | jq .content[0].text | fromjson > results.json

二、浏览器自动化层 (PinchTab)

2.1 与 Apify 的互补关系

场景使用 Apify使用 PinchTab
大规模数据采集✅ 云端 Actor,并发高❌ 本地运行,资源有限
需要登录/认证
⚠️ 需要 Cookie | ✅ 支持登录态保留 | | 实时交互测试 | ❌ 不适合 | ✅ 点击、输入、验证 | | 视觉回归测试 | ❌ 不支持 | ✅ 截图对比 | | Token 敏感场景 | ❌ 成本高 | ✅ 文本提取省 Token | | 动态内容渲染 | ✅ 云端渲染 | ✅ 本地渲染 |

2.2 混合工作流示例

场景:监测竞品网站 + 分析其社交媒体

bash

Step 1: 使用 PinchTab 访问竞品网站,提取关键信息


pinchtab nav https://competitor.com
sleep 3
pinchtab text > competitor-content.txt

Step 2: 从网站提取社交媒体链接

grep -oE (instagram|facebook|tiktok)\.com/[^ ]+ competitor-content.txt > social-links.txt

Step 3: 使用 Apify 分析其社交媒体

export $(grep APIFY_TOKEN .env | xargs) && mcpc --json mcp.apify.com \ --header Authorization: Bearer $APIFY_TOKEN \ tools-call run-actor \ actor:=apify/instagram-profile-scraper \ input:={usernames: [competitor_ig]} \ > competitor-ig-data.json

Step 4: 数据分析

node analyze-competitor.js competitor-ig-data.json

2.3 数据采集黄金组合

数据类型Apify ActorPinchTab 补充
商家信息Google Maps Actor官网详情验证
产品信息
电商 Actor | 价格实时监控 | | 用户评论 | 平台评论 Actor | 情感分析可视化 | | 社交媒体 | Instagram/TikTok Actor | 内容趋势监测 |

三、内容分析层

3.1 数据采集后的内容工作流

Apify 采集数据

数据清洗 (Python/pandas)

内容分析 (内容工厂技能)

生成报告 / 发布内容

3.2 数据分析模板

竞品

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 data-intelligence-1776191633 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 data-intelligence-1776191633 技能

通过命令行安装

skillhub install data-intelligence-1776191633

下载

⬇ 下载 data-intelligence v1.0.0(免费)

文件大小: 10.59 KB | 发布时间: 2026-4-15 13:03

v1.0.0 最新 2026-4-15 13:03
Initial release of Data Intelligence – a comprehensive data acquisition and analysis platform.

- Integrates Apify cloud crawlers, PinchTab browser automation, and content analysis into unified workflows.
- Supports over 55 platforms for lead generation, e-commerce intelligence, competitor analysis, trend research, and automated browser testing.
- Provides quick-start guides, command-line workflow examples, and practical scripts for real-world use cases.
- Includes detailed templates for data analysis and reporting.
- Enables hybrid collection strategies combining cloud and local automation for flexible data extraction.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部