返回顶部
c

crawl4ai-skill网页爬虫工具

Web crawling and scraping tool with LLM-optimized output. 网页爬虫爬取工具 | Web crawler, web scraper, spider. DuckDuckGo search, site crawling, dynamic page scraping. 智能搜索爬取 | Free, no API key required.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.10
安全检测
已通过
2,162
下载量
免费
免费
3
收藏
概述
安装方式
版本历史

crawl4ai-skill

Crawl4AI 技能 - 网页爬虫与抓取工具

网页爬虫 | 网页抓取 | LLM 优化输出

智能网页爬虫和抓取工具,支持搜索、全站爬取、动态页面抓取。免费网页爬虫与抓取工具,提供LLM优化的Markdown输出。

核心功能

  • - 🔍 网页搜索 - DuckDuckGo搜索,无需API密钥
  • 🕷️ 网页爬虫 - 站点爬虫、蜘蛛、站点地图识别
  • 📝 网页抓取 - 智能抓取、数据提取
  • 📄 LLM优化输出 - 适配Markdown,节省80%令牌
  • 动态页面抓取 - JavaScript渲染页面爬取

快速开始

安装

bash
pip install crawl4ai-skill

网页搜索

bash

使用DuckDuckGo搜索网络


crawl4ai-skill search python web scraping

单页爬取

bash

抓取单个网页


crawl4ai-skill crawl https://example.com

全站爬虫

bash

爬取整个网站/蜘蛛爬取


crawl4ai-skill crawl-site https://docs.python.org --max-pages 50


使用场景

场景1:文档站爬虫

bash

使用蜘蛛爬取文档站点


crawl4ai-skill crawl-site https://docs.fastapi.com --max-pages 100

爬虫效果:

  • - ❌ 移除:导航栏、侧边栏、广告
  • ✅ 保留:标题、正文、代码块
  • 📊 令牌:50,000 → 10,000(-80%)

场景2:搜索+爬取

bash

搜索并抓取排名靠前的结果


crawl4ai-skill search-and-crawl Vue 3 best practices --crawl-top 3

场景3:动态页面抓取

JavaScript渲染的页面爬取(雪球、知乎等):

bash

抓取JavaScript密集型页面


crawl4ai-skill crawl https://xueqiu.com/S/BIDU --wait-until networkidle --delay 2


命令参考


命令说明
search <query>网页搜索
crawl <url>
单页爬取 |
| crawl-site | 全站爬虫 |
| search-and-crawl | 搜索并爬取 |

常用参数

bash

网页搜索


--num-results 10 # 结果数量

网页爬取

--format fit_markdown # 输出格式 --output result.md # 输出文件 --wait-until networkidle # 动态页面等待策略 --delay 2 # 额外等待时间(秒) --wait-for .selector # 等待特定元素

全站爬虫

--max-pages 100 # 最大爬取页面数 --max-depth 3 # 最大爬取深度

输出格式

fit_markdown(推荐)

智能提取,节省80%令牌。

bash
crawl4ai-skill crawl https://example.com --format fit_markdown

raw_markdown

保留完整结构。

bash
crawl4ai-skill crawl https://example.com --format raw_markdown



为什么选择这个爬虫?

免费爬虫 - 无需API密钥,开箱即用
智能抓取 - 自动去噪,提取核心内容
全站爬虫 - 支持站点地图,递归爬取
动态爬取 - 支持JavaScript渲染页面
搜索集成 - 内置DuckDuckGo搜索



链接

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 crawl4ai-skill-1776171434 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 crawl4ai-skill-1776171434 技能

通过命令行安装

skillhub install crawl4ai-skill-1776171434

下载

⬇ 下载 crawl4ai-skill v1.0.10(免费)

文件大小: 2.58 KB | 发布时间: 2026-4-15 11:54

v1.0.10 最新 2026-4-15 11:54
**Crawl4AI Skill 1.1.0 — Bilingual, Expanded Doc, and Dynamic Scraping**

- Major rewrite of documentation for improved clarity; now fully bilingual (English & Chinese).
- Expanded feature list to highlight DuckDuckGo search, full-site crawling, dynamic page (JavaScript) scraping, and LLM-optimized outputs.
- Added command examples and use cases for both static and dynamic web pages.
- More tags introduced for better discoverability (e.g., spider, crawler, 爬虫).
- Added comparison and value proposition section: free, no API key, smart extraction, dynamic content support.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部