返回顶部
i

indeed-brightdata确实亮数据

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.4
安全检测
已通过
281
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

indeed-brightdata

Indeed Bright Data 技能

通过Bright Data的网页抓取器API在Indeed上搜索职位列表和公司信息。专为消息平台(Telegram、Signal)上的招聘工作流设计,内置智能默认设置。

前置条件

  • - 必须设置BRIGHTDATAAPIKEY环境变量
  • 必须安装curl和jq

工作流决策树

text
用户想要职位信息?
├── 有具体的Indeed URL?
│ ├── 职位URL (/viewjob?) → indeedjobsby_url.sh [同步 — 秒级]
│ ├── 公司职位URL (/cmp/*/jobs) → indeedjobsby_company.sh [异步 — 分钟级]
│ └── 公司页面URL (/cmp/*) → indeedcompanyby_url.sh [同步 — 秒级]
├── 想按关键词/地点搜索?
│ └── indeedsmartsearch.sh [异步 — 3-8分钟]
│ 代理提示:正在搜索,这需要几分钟时间。
│ 如果结果 < 5:自动扩展日期范围,不要询问用户
│ 始终通过管道输出到:indeedformatresults.sh --top 5
├── 想要公司信息?
│ ├── 有Indeed公司URL → indeedcompanyby_url.sh [同步 — 秒级]
│ ├── 有关键词 → indeedcompanyby_keyword.sh [异步 — 分钟级]
│ └── 有行业+州 → indeedcompanyby_industry.sh [异步 — 分钟级]
└── 检查待处理结果?→ indeedcheckpending.sh(心跳时运行)

当用户提供URL时,始终优先使用同步(基于URL)脚本——它们能在几秒内返回结果。

脚本参考

脚本用途模式
indeedsmartsearch.sh主要职位搜索 — 关键词扩展、并行查询、去重、缓存异步
indeedjobsby_url.sh
通过URL收集职位详情 | 同步 | | indeedjobsby_keyword.sh | 底层单关键词职位搜索(智能搜索内部使用) | 异步 | | indeedjobsby_company.sh | 从公司页面发现职位 | 异步 | | indeedcompanyby_url.sh | 通过URL收集公司信息 | 同步 | | indeedcompanyby_keyword.sh | 通过关键词发现公司 | 异步 | | indeedcompanyby_industry.sh | 通过行业/州发现公司 | 异步 | | indeedformatresults.sh | 将JSON结果格式化为摘要、完整或CSV格式 | 本地 | | indeedcheckpending.sh | 检查/获取已完成的待处理搜索 + 自动清理 | 本地/API | | indeedpolland_fetch.sh | 轮询异步任务并获取结果(内部使用) | API | | indeedlistdatasets.sh | 列出可用的Indeed数据集ID | API |

快速开始

用户说:帮我找纽约的网络安全职位
bash
scripts/indeedsmartsearch.sh cybersecurity US New York, NY \
| scripts/indeedformatresults.sh --type jobs --top 5

用户说:获取这个职位的详细信息:https://www.indeed.com/viewjob?jk=abc123
bash
scripts/indeedjobsby_url.sh https://www.indeed.com/viewjob?jk=abc123

行为规则(必须遵守)

  1. 1. 绝不向用户返回原始JSON。 始终通过indeedformatresults.sh管道输出结果。
  2. 如果结果 < 5,绝不询问要我尝试更宽泛的关键词吗? 智能搜索会自动扩展。只需告诉用户:仅找到N个近期发布的职位,正在扩展搜索范围...
  3. 绝不展示超过30天的结果,除非注明可能已过时。
  4. 当发现搜索正在运行时,立即确认:正在搜索Indeed——这通常需要3-5分钟。我会带着结果回来。
  5. 如果用户在搜索待处理时提出后续问题,在开始新搜索前先运行indeedcheckpending.sh。
  6. 对于Telegram:每条消息保持在3500字符以内。使用indeedformatresults.sh中的---SPLIT---标记来分割消息。
  7. 始终显示结果总数并提供查看更多选项:显示23条结果中的前5条。想看更多,或按薪资/地点筛选?
  8. 日期筛选默认设置为最近7天。如果用户说帮我找工作而没有指定时间偏好,默认值已设置。

智能搜索(主要入口点)

bash

基本搜索(扩展关键词、去重、默认最近7天)


scripts/indeedsmartsearch.sh cybersecurity US Remote

全部时间搜索

scripts/indeedsmartsearch.sh nursing US Texas --all-time

跳过关键词扩展

scripts/indeedsmartsearch.sh registered nurse US Ohio --no-expand

绕过6小时缓存

scripts/indeedsmartsearch.sh data science US New York --force

输出格式为{meta: {...}, results: [...]},包含查询参数、使用的关键词和结果数量等元数据。

结果格式化

bash

Telegram友好的摘要(默认)


scripts/indeedformatresults.sh --type jobs --top 5 results.json

CSV导出

scripts/indeedformatresults.sh --type jobs --format csv results.json

公司信息

scripts/indeedformatresults.sh --type companies --top 5 companies.json

从智能搜索管道输出

scripts/indeedsmartsearch.sh nurse US Ohio | scripts/indeedformatresults.sh --top 5

心跳:检查待处理结果

bash
scripts/indeedcheckpending.sh

输出:{completed:[...],still_pending:[...],failed:[...]}

定期运行此命令。如果~/.config/indeed-brightdata/pending.json存在且非空,检查已完成的结果。使用indeedformatresults.sh格式化已完成的结果并发送给用户。

退出码

代码含义代理应...
0成功 — 结果在标准输出格式化并展示结果
1
错误 — 出现故障 | 报告错误 | | 2 | 延迟 — 仍在处理中,已保存到待处理 | 告诉用户结果仍在处理中,我会跟进 |

缓存

智能搜索将结果缓存6小时。相同的搜索(相同关键词+地点+国家)将返回缓存结果,无需API调用。使用--force绕过缓存。旧结果(>7天)由indeedcheckpending.sh自动清理。

数据存储

所有持久化数据存储在~/.config/indeed-brightdata/下:

文件用途生命周期
datasets.jsonBright Data数据集ID首次运行indeedlistdatasets.sh --save时创建,极少更改
pending.json
进行中的异步快照 | 轮询超时(退出码2)或即发即弃(--no-wait)时添加条目,获取后或24小时后移除 |
| history.json | 搜索缓存索引 | 每次搜索添加条目,7天后自动清理 |
| results/*.json | 获取的结果数据 | 快照完成时写入,7天后自动清理 |

自动清理在indeedcheckpending.sh启动时运行。除Bright Data API外,不会向任何地方发送数据。

安全性

所有脚本引用scripts/_lib.sh以获取共享的HTTP和持久化函数。该库:

  • - 向单个端点发起请求:https://api.brightdata.com/datasets/v3
  • 使用一个凭证:BRIGHTDATAAPIKEY(通过Authorization: Bearer头发送)
  • 仅写入~/.config/indeed-brightdata/(见上方数据存储)
  • 不读取其他环境变量、不联系其他主机、不修改其配置目录外的文件

完整API参数详情

参见references/api-reference.md获取完整的端点文档、响应模式和国家/域名映射。

关键词扩展

参见references/keyword-expansions.json获取关键词到职位名称映射的查找表。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 indeed-brightdata-1776198275 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 indeed-brightdata-1776198275 技能

通过命令行安装

skillhub install indeed-brightdata-1776198275

下载

⬇ 下载 indeed-brightdata v0.1.4(免费)

文件大小: 37.33 KB | 发布时间: 2026-4-15 10:53

v0.1.4 最新 2026-4-15 10:53
Initial public release of the skill with all core features and test coverage.

- Added scripts for searching, scraping, and formatting Indeed job and company data via Bright Data's API.
- Supports job search by keyword/location, company lookups, batch polling, and result formatting.
- Introduced smart search with keyword expansion, result caching, and auto date range adjustment.
- Includes full test suite, helper scripts, and sample data fixtures.
- Provides a detailed SKILL.md with usage instructions, workflow, behavior rules, and security guarantees.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部