返回顶部
w

weixin-reader微信文章提取

提取微信公众号文章内容,支持任意公众号文章链接的内容抓取和结构化输出。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.0
安全检测
已通过
545
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

weixin-reader

微信公众号阅读器

提取微信公众号文章内容,支持任意公众号文章链接的内容抓取。

使用方法

直接发送微信公众号文章链接即可:

  • - https://mp.weixin.qq.com/s/xxxx

功能

  • - 自动渲染 JavaScript 动态内容
  • 提取标题、作者、公众号名称、发布时间、正文内容
  • 输出干净的 Markdown 格式
  • SSRF 防护:DNS 解析验证,防止访问内网地址

依赖

  • - Python 3.8+
  • Playwright
  • playwright-stealth(反爬增强,可选)
  • dnspython(DNS 解析安全校验)

安装依赖:
bash
cd ~/.openclaw/workspace/skills/weixin-reader
pip install -r requirements.txt
playwright install chromium

安全说明

SSRF 防护

  • - 禁止访问 localhost、127.0.0.1 等本地地址
  • 禁止访问 10.x.x.x、172.16-31.x.x、192.168.x.x 等私有网段
  • DNS 解析检查:验证域名解析后的 IP 不是内网地址(防止 DNS 重绑定攻击)

使用限制

  • - 仅支持提取公开文章内容
  • 请遵守目标网站的服务条款
  • 不建议用于高频批量抓取

文件说明

  • - extract.py - 主提取脚本(推荐,标准模式)
  • extractstealth.py - 反爬增强模式(可选,使用 playwright-stealth,可能违反某些网站 ToS)
  • extractgeneric.py - 通用网页提取

更新日志

v1.1.0

  • - 结构化数据输出:返回 JSON 格式,包含 metadata、content、stats 三个部分
  • 新增统计信息:字数、段落数、图片数、预估阅读时间
  • 增强元数据:提取时间戳、文章描述、HTML 内容
  • 图片信息丰富:返回图片 URL 和 alt 文本

v1.0.1

  • - 增强 SSRF 防护:添加 DNS 解析验证
  • 补充完整依赖:playwright-stealth, dnspython
  • 完善安全说明文档

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 weixin-reader-1776189569 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 weixin-reader-1776189569 技能

通过命令行安装

skillhub install weixin-reader-1776189569

下载

⬇ 下载 weixin-reader v1.1.0(免费)

文件大小: 15.69 KB | 发布时间: 2026-4-15 12:38

v1.1.0 最新 2026-4-15 12:38
v1.1.0:结构化数据输出,新增统计信息和元数据

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部