返回顶部
t

tech-news-digest科技新闻摘要

Generate tech news digests with unified source model, quality scoring, and multi-format output. Six-source data collection from RSS feeds, Twitter/X KOLs, GitHub releases, GitHub Trending, Reddit, and web search. Pipeline-based scripts with retry mechanisms and deduplication. Supports Discord, email, and markdown templates.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 3.15.0
安全检测
已通过
266
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

tech-news-digest

技术新闻摘要

自动化技术新闻摘要系统,具有统一数据源模型、质量评分流水线和基于模板的输出生成功能。

快速开始

  1. 1. 配置设置:默认配置位于 config/defaults/。复制到工作区进行自定义:
bash mkdir -p workspace/config cp config/defaults/sources.json workspace/config/tech-news-digest-sources.json cp config/defaults/topics.json workspace/config/tech-news-digest-topics.json
  1. 2. 环境变量
- TWITTERAPIIOKEY - twitterapi.io API密钥(可选,推荐) - XBEARERTOKEN - Twitter/X官方API承载令牌(可选,备用) - TAVILYAPIKEY - Tavily搜索API密钥,Brave的替代方案(可选) - WEBSEARCHBACKEND - 网络搜索后端:auto|brave|tavily(可选,默认:auto) - BRAVEAPIKEYS - Brave搜索API密钥,逗号分隔用于轮换(可选) - BRAVEAPIKEY - 单个Brave密钥备用(可选) - GITHUB_TOKEN - GitHub个人访问令牌(可选,提高速率限制)
  1. 3. 生成摘要
bash # 统一流水线(推荐)— 并行运行所有6个数据源 + 合并 python3 scripts/run-pipeline.py \ --defaults config/defaults \ --config workspace/config \ --hours 48 --freshness pd \ --archive-dir workspace/archive/tech-news-digest/ \ --output /tmp/td-merged.json --verbose --force
  1. 4. 使用模板:对合并后的输出应用Discord、电子邮件或PDF模板

配置文件

sources.json - 统一数据源

json { sources: [ { id: openai-rss, type: rss, name: OpenAI博客, url: https://openai.com/blog/rss.xml, enabled: true, priority: true, topics: [llm, ai-agent], note: OpenAI官方更新 }, { id: sama-twitter, type: twitter, name: Sam Altman, handle: sama, enabled: true, priority: true, topics: [llm, frontier-tech], note: OpenAI首席执行官 } ] }

topics.json - 增强主题定义

json { topics: [ { id: llm, emoji: 🧠, label: LLM / 大模型, description: 大型语言模型、基础模型、突破性进展, search: { queries: [LLM最新新闻, 大型语言模型突破], must_include: [LLM, 大型语言模型, 基础模型], exclude: [教程, 初学者指南] }, display: { max_items: 8, style: detailed } } ] }

脚本流水线

run-pipeline.py - 统一流水线(推荐)

bash python3 scripts/run-pipeline.py \ --defaults config/defaults [--config CONFIG_DIR] \ --hours 48 --freshness pd \ --archive-dir workspace/archive/tech-news-digest/ \ --output /tmp/td-merged.json --verbose --force
  • - 功能:并行运行所有6个获取步骤,然后合并+去重+评分
  • 输出:最终合并的JSON,可用于报告生成(总计约30秒)
  • 元数据:将每个步骤的时间和计数保存到*.meta.json
  • GitHub认证:如果未设置$GITHUB_TOKEN,自动生成GitHub应用令牌
  • 备用方案:如果失败,运行下面的单个脚本

单个脚本(备用)

fetch-rss.py - RSS订阅源获取器

bash python3 scripts/fetch-rss.py [--defaults DIR] [--config DIR] [--hours 48] [--output FILE] [--verbose]
  • - 并行获取(10个工作线程),带退避的重试,feedparser + 正则表达式备用
  • 超时:每个订阅源30秒,ETag/Last-Modified缓存

fetch-twitter.py - Twitter/X KOL监控

bash python3 scripts/fetch-twitter.py [--defaults DIR] [--config DIR] [--hours 48] [--output FILE] [--backend auto|official|twitterapiio]
  • - 后端自动检测:如果设置了TWITTERAPIIOKEY则使用twitterapi.io,否则如果设置了XBEARERTOKEN则使用官方X API v2
  • 速率限制处理、互动指标、带退避的重试

fetch-web.py - 网络搜索引擎

bash python3 scripts/fetch-web.py [--defaults DIR] [--config DIR] [--freshness pd] [--output FILE]
  • - 自动检测Brave API速率限制:付费计划→并行查询,免费→顺序执行
  • 无API:为代理生成搜索界面

fetch-github.py - GitHub发布监控

bash python3 scripts/fetch-github.py [--defaults DIR] [--config DIR] [--hours 168] [--output FILE]
  • - 并行获取(10个工作线程),30秒超时
  • 认证优先级:$GITHUB_TOKEN → GitHub应用自动生成 → gh CLI → 未认证(60次/小时)

fetch-github.py --trending - GitHub趋势仓库

bash python3 scripts/fetch-github.py --trending [--hours 48] [--output FILE] [--verbose]
  • - 搜索GitHub API获取4个主题(LLM、AI代理、加密货币、前沿科技)的趋势仓库
  • 质量评分:基础5分 + dailystarsest / 10,最高15分

fetch-reddit.py - Reddit帖子获取器

bash python3 scripts/fetch-reddit.py [--defaults DIR] [--config DIR] [--hours 48] [--output FILE]
  • - 并行获取(4个工作线程),公共JSON API(无需认证)
  • 13个子版块,带评分过滤

enrich-articles.py - 文章全文丰富

bash python3 scripts/enrich-articles.py --input merged.json --output enriched.json [--min-score 10] [--max-articles 15] [--verbose]
  • - 获取高分文章的全文
  • Cloudflare Markdown for Agents(推荐)→ HTML提取(备用)→ 跳过(付费墙/社交)
  • 博客域名白名单,评分阈值较低(≥3)
  • 并行获取(5个工作线程,10秒超时)

merge-sources.py - 质量评分与去重

bash python3 scripts/merge-sources.py --rss FILE --twitter FILE --web FILE --github FILE --reddit FILE
  • - 质量评分、标题相似度去重(85%)、先前摘要惩罚
  • 输出:按评分排序的按主题分组的文章

validate-config.py - 配置验证器

bash python3 scripts/validate-config.py [--defaults DIR] [--config DIR] [--verbose]
  • - JSON模式验证、主题引用检查、重复ID检测

generate-pdf.py - PDF报告生成器

bash python3 scripts/generate-pdf.py --input report.md --output digest.pdf [--verbose]
  • - 将Markdown摘要转换为带中文排版的样式化A4 PDF(Noto Sans CJK SC)
  • 表情符号图标、页眉/页脚、蓝色主题。需要weasyprint。

sanitize-html.py - 安全HTML电子邮件转换器

bash python3 scripts/sanitize-html.py --input report.md --output email.html [--verbose]
  • - 将Markdown转换为带内联CSS的XSS安全HTML电子邮件
  • URL白名单(仅http/https)、HTML转义文本内容

source-health.py - 数据源健康监控

bash python3 scripts/source-health.py --rss FILE --twitter FILE --github FILE --reddit FILE --web FILE [--verbose]
  • - 跟踪每个数据源7天内的成功/失败历史
  • 报告不健康的数据源(失败率>50%)

summarize-merged.py - 合并数据摘要

bash python3 scripts/summarize-merged.py --input merged.json [--top N] [--topic TOPIC]
  • - 供LLM

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 dinstein-tech-news-digest-1776056704 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 dinstein-tech-news-digest-1776056704 技能

通过命令行安装

skillhub install dinstein-tech-news-digest-1776056704

下载

⬇ 下载 tech-news-digest v3.15.0(免费)

文件大小: 121.46 KB | 发布时间: 2026-4-14 13:48

v3.15.0 最新 2026-4-14 13:48
- Added detailed documentation for setup, configuration, and script usage to SKILL.md.
- Clarified environment variables and backend selection for Twitter/X and web search.
- Expanded instructions for customizing sources and topics.
- Documented all scripts and pipelines, including parallel fetching, deduplication, and fallback mechanisms.
- Updated examples for digest generation and template usage.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部