返回顶部
n

novel-scraper小说抓取器

>-

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.6.0
安全检测
已通过
497
下载量
免费
免费
3
收藏
概述
安装方式
版本历史

novel-scraper

Novel Scraper - 小说抓取工具

版本说明:novel-scraper 提供两个版本,根据需求选择使用。



📦 版本对比


特性v1.4.0(生产版)V5(智能版)
章节号解析URL ID 推算标题提取 ✅
分页检测
❌ 无 | ✅ 自动 ✅ |
| 分页补全 | ❌ 无 | ✅ 自动(最多 5 页)✅ |
| 非小说跳过 | ❌ 无 | ✅ 智能判断 ✅ |
| 质量验证 | ❌ 无 | ✅ 基础验证 ✅ |
| 连续性检查 | ❌ 无 | ✅ 自动检查 ✅ |
| 代码量 | 34KB | 18KB |
| 速度 | ⚡ 最快 | ⚡ 快 |
| 推荐场景 | 日常批量抓取 | 高质量/分页章节 |


🚀 快速开始

v1.5.0(推荐)- 按章节号抓取

bash
cd ~/.openclaw/workspace/skills/novel-scraper
python3 scripts/scraper_v5.py \
--chapters 301-400 \
--book 没钱修什么仙 \
--merge-interval 10

特点

  • - ✅ 按章节号精确筛选(修复索引切片 bug)
  • ✅ 自动提示缺失章节
  • ✅ 分页自动补全
  • ✅ 适合按章节范围抓取的场景



v1.4.0(生产版)- 日常使用

bash
cd ~/.openclaw/workspace/skills/novel-scraper
python3 scripts/scraper.py \
--urls https://www.bqquge.com/4/1962,https://www.bqquge.com/4/1963,... \
--book 没钱修什么仙 \
--merge-interval 10

特点

  • - ✅ 稳定可靠
  • ✅ 速度最快
  • ✅ 适合已知章节 URL 连续的场景



V5(智能版)- 高质量抓取

bash
python3 scripts/scraper_v5.py \
--chapters 301-400 \
--book 没钱修什么仙 \
--merge-interval 10

特点

  • - ✅ 章节号自动解析
  • ✅ 分页自动补全
  • ✅ 非小说内容智能跳过
  • ✅ 适合分页章节较多的场景



📋 命令行参数

v1.5.0 参数(推荐)

参数说明默认值
--chapters章节号范围(格式:起始 - 结束)-
--url
单章 URL | - | | --urls | 多章 URL(逗号分隔) | - | | --book | 书名 | 自动提取 | | --merge-interval | 每 N 章合并 | 10 | | --memory-limit | 内存限制 MB | 2500 | | --auto-close | 每 N 章释放内存 | 3 | | --retry | 重试次数 | 3 |

⚠️ v1.5.0 重要修复

  • - 修复索引切片 bug(之前 data[300:400] 错误对应章节号 300-419)
  • 新增 --chapters 参数,按章节号精确筛选
  • 自动提示缺失章节(网站目录中没有的章节)

V5 参数

参数说明默认值
--chapters章节号范围(格式:起始 - 结束)-
--url
单章 URL | - | | --urls | 多章 URL(逗号分隔) | - | | --book | 书名 | 自动提取 | | --merge-interval | 每 N 章合并 | 10 | | --strict | 严格质量验证 | 关闭 | | -v | 详细日志 | 关闭 |

📁 输出位置

~/.openclaw/workspace/novels/

文件名格式

  • - 多章合并:书名第 X-Y 章.txt
  • 单章:书名第 X 章.txt



🧪 测试验证


测试场景版本结果
第 1-10 章V5✅ 119KB,完整
第 11-20 章
V5 | ✅ 100KB,完整 |
| 第 111-210 章 | v1.4.0 | ✅ 10 个文件,~700KB |
| 分页补全 | V5 | ✅ 28 段→112 段 |
| 非小说跳过 | V5 | ✅ 自动跳过 |


🔧 故障排除

抓取内容为空

  1. 1. 检查 URL 格式
  2. 清除缓存:rm -rf /tmp/novelscrapercache/*
  3. 检查网站是否可访问

章节号不正确

  • - 使用 V5 自动从标题解析章节号

文件保存位置

bash ls -lt ~/.openclaw/workspace/novels/ | head -5
版本: 1.4.0 更新: 2026-04-02 详见: CHANGELOG.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 novel-scraper-1776099328 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 novel-scraper-1776099328 技能

通过命令行安装

skillhub install novel-scraper-1776099328

下载

⬇ 下载 novel-scraper v1.6.0(免费)

文件大小: 26.87 KB | 发布时间: 2026-4-15 13:38

v1.6.0 最新 2026-4-15 13:38
代码质量修复:删除未使用导入和变量,修复 f-string 问题,通过 ruff check 所有检查

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部