返回顶部
e

emerging-topic-scout新兴主题侦察

Monitor bioRxiv/medRxiv preprints and academic discussions to identify

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
136
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

emerging-topic-scout

新兴主题侦察员

一个实时监控系统,用于识别生物和医学科学中在主流期刊定义之前的潜伏期研究热点。

概述

本技能持续监控:

  • - bioRxiv:通过RSS/API获取生物学预印本 ⚠️ 目前被Cloudflare屏蔽
  • medRxiv:通过RSS/API获取医学预印本 ⚠️ 目前被Cloudflare屏蔽
  • arXiv:通过RSS获取定量生物学预印本 ✅ 推荐替代方案
  • 学术讨论:社交媒体和论坛提及

它使用趋势分析算法来检测主题频率的突然激增、跨平台提及以及新兴关键词集群。

⚠️ 网络访问说明

bioRxiv和medRxiv目前受Cloudflare JavaScript挑战保护,阻止了程序化RSS访问。作为变通方案,本技能现在支持arXiv q-bio(定量生物学)作为替代数据源。

推荐用法:
bash

使用arXiv获取可靠数据


python scripts/main.py --sources arxiv --days 30

bioRxiv/medRxiv由于Cloudflare保护可能返回0结果

python scripts/main.py --sources biorxiv medrxiv --days 30 # 可能无法工作

安装

bash
cd /Users/z04030865/.openclaw/workspace/skills/emerging-topic-scout
pip install -r scripts/requirements.txt

使用方法

基础扫描(推荐:使用arXiv)

bash
python scripts/main.py --sources arxiv --days 7 --output json

旧版bioRxiv/medRxiv(由于Cloudflare可能无法工作)

bash
python scripts/main.py --sources biorxiv medrxiv --days 7 --output json

高级配置(推荐arXiv)

bash
python scripts/main.py \
--sources arxiv \
--keywords CRISPR,基因编辑,机器学习 \
--days 14 \
--min-score 0.7 \
--output markdown \
--notify

旧版配置(bioRxiv/medRxiv - 可能无法工作)

bash
python scripts/main.py \
--sources biorxiv medrxiv \
--keywords CRISPR,基因编辑,长新冠 \
--days 14 \
--min-score 0.7 \
--output markdown \
--notify

注意:bioRxiv/medRxiv由于Cloudflare保护可能返回0结果

参数

参数类型默认值描述
--sources列表arxiv要监控的数据源(由于biorxiv/medrxiv存在Cloudflare问题,推荐使用arxiv)
--keywords
字符串 | (自动检测) | 要跟踪的逗号分隔关键词 | | --days | 整数 | 7 | 回溯天数 | | --min-score | 浮点数 | 0.6 | 最低趋势评分(0-1) | | --max-topics | 整数 | 20 | 返回的最大主题数 | | --output | 字符串 | markdown | 输出格式:json、markdown、csv | | --notify | 标志 | false | 为高优先级主题发送通知 | | --config | 路径 | config.yaml | 配置文件路径 |

输出格式

JSON输出

json
{
scan_date: 2026-02-06T05:57:00Z,
sources: [biorxiv, medrxiv],
hot_topics: [
{
topic: 基因编辑疗法,
keywords: [CRISPR, 碱基编辑, 先导编辑],
trending_score: 0.89,
velocity: 快速,
preprint_count: 34,
crossplatformmentions: 127,
related_papers: [
{
title: 新型CRISPR变体展现前景,
authors: [Smith J., Lee K.],
doi: 10.1101/2026.01.15.xxxxx,
source: biorxiv,
published: 2026-01-15,
abstract_summary: ...
}
],
emerging_since: 2026-01-20
}
],
summary: {
totalpapersanalyzed: 1247,
newtopicsdetected: 8,
highpriorityalerts: 2
}
}

Markdown输出

markdown

新兴主题报告 - 2026-02-06

🔥 高优先级主题

1. 基因编辑疗法(评分:0.89)

  • - 关键词:CRISPR、碱基编辑、先导编辑
  • 增长率:快速(较上周增长+145%)
  • 预印本:34篇论文
  • 跨平台提及:127次

关键论文

  1. 1. 新型CRISPR变体展现前景 - Smith J.等
- DOI:10.1101/2026.01.15.xxxxx - 来源:bioRxiv

配置文件

创建config.yaml以持久化设置:

yaml
sources:
arxiv:
enabled: true
rss_url: https://export.arxiv.org/rss/q-bio
description: arXiv定量生物学 - 推荐(无Cloudflare)
biorxiv:
enabled: false # 因Cloudflare保护而禁用
rss_url: https://www.biorxiv.org/rss/recent.rss
api_endpoint: https://api.biorxiv.org/details/
note: 目前被Cloudflare JavaScript挑战屏蔽
medrxiv:
enabled: false # 因Cloudflare保护而禁用
rss_url: https://www.medrxiv.org/rss/recent.rss
api_endpoint: https://api.medrxiv.org/details/
note: 目前被Cloudflare JavaScript挑战屏蔽

trending:
minpapersthreshold: 5
velocitywindowdays: 3
novelty_weight: 0.4
momentum_weight: 0.6

keywords:
auto_detect: true
custom_trackers:
- 人工智能
- 机器学习
- 单细胞
- 空间转录组学

output:
default_format: markdown
save_history: true
history_path: ./data/history.json

notifications:
enabled: false
highscorethreshold: 0.8

趋势评分算法

趋势评分(0-1)使用以下公式计算:

评分 = (新颖性 × 0.4) + (动量 × 0.4) + (交叉引用 × 0.2)

其中:

  • - 新颖性:主题在历史数据中的逆频率
  • 动量:在速度窗口内提及次数的增长率
  • 交叉引用:跨多个平台的提及

API端点

bioRxiv API

  • - 基础:https://api.biorxiv.org/
  • 详情:/details/[服务器]/[DOI]/[格式]
  • 发布:/pub/[DOI]/[格式]

medRxiv API

  • - 与bioRxiv结构相同

数据存储

历史数据存储在data/history.json中,用于:

  • - 趋势比较
  • 速度计算
  • 重复检测

示例

示例1:快速每日扫描(arXiv - 推荐)

bash
python scripts/main.py --sources arxiv --days 1 --output markdown

示例2:使用bioRxiv进行每日扫描(可能无法工作)

bash
python scripts/main.py --sources biorxiv --days 1 --output markdown

注意:由于Cloudflare保护,可能返回0结果

示例2:每周深度分析

bash
python scripts/main.py \
--days 7 \
--min-score 0.7 \
--max-topics 50 \
--output json \
> weekly_report.json

示例3:跟踪特定研究领域

bash
python scripts/main.py \
--keywords 阿尔茨海默病,神经退行性变,淀粉样蛋白 \
--days 30 \
--min-score 0.5

已知问题

bioRxiv/medRxiv Cloudflare保护

状态: ❌ 已屏蔽 问题: bioRxiv和medRxiv的RSS源受Cloudflare JavaScript挑战保护,阻止了程序化访问。该网站返回需要JavaScript执行和Cookie验证的HTML页面。

已尝试的解决方案:
1.

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 emerging-topic-scout-1776127562 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 emerging-topic-scout-1776127562 技能

通过命令行安装

skillhub install emerging-topic-scout-1776127562

下载

⬇ 下载 emerging-topic-scout v0.1.0(免费)

文件大小: 17.33 KB | 发布时间: 2026-4-14 14:22

v0.1.0 最新 2026-4-14 14:22
- Initial release of Emerging Topic Scout for real-time monitoring of emerging research topics in biological and medical sciences.
- Supports trend detection by analyzing preprint servers (arXiv q-bio recommended) and social/academic discussions.
- bioRxiv and medRxiv programmatic access currently blocked by Cloudflare; arXiv remains fully supported.
- Provides configurable scanning, keyword tracking, trending score calculation, and multiple output formats (JSON, Markdown, CSV).
- Example configurations and output formats included; recommends arXiv as a reliable data source.
- Documentation covers usage instructions, configuration, output, and known issues.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部