scholar-search
概述
本 skill 通过统一的命令行脚本 scripts/scholar-search.py 封装 arXiv 和 Semantic Scholar API,支持学术论文检索、详情拉取、引用网络扩展与作者轨迹分析。
前置条件
- - Python
- 所需依赖: INLINECODE1
pip install requests
-
S2_API_KEY - Semantic Scholar API 密钥(必需;优先从进程环境变量读取)
- - 当我在对话中直接提供 Semantic Scholar API Key 时,必须先写入:
python scripts/set_s2_api_key.py --api-key "<我提供的key>"
- - 写入策略:
S2_API_KEY 已存在则覆盖,不存在则自动追加到 scripts/.env。 - 读取策略:优先读进程环境变量
S2_API_KEY,若未设置则回退读取 scripts/.env。 - 命令占位符约定:
- 技能目录根路径(
skills/scholar-search)。
- 统一脚本路径写法:、
scripts/scholar-search.py。
可用工具
- -
scripts/scholar-search.py:主检索脚本,执行 arXiv + Semantic Scholar 联合检索与结果整理。 - INLINECODE10 :写入或覆盖
.env 中的 S2_API_KEY,用于配置 Semantic Scholar API Key。
详细操作手册
- -
references/semantic-scholar-api-reference.md:Semantic Scholar API 的端点、参数与字段参考,用于核对调用细节。 - INLINECODE14 :arXiv API 的查询语法与参数说明,用于核对 arXiv 检索细节。
工作流
1) 解读我的需求
先提取并标准化以下约束:
- 1. 查询实体:关键词、paperid、authorid、DOI、arXiv ID、作者姓名,学科等等。
- 时间和过滤:year、venue、publicationTypes、fieldsOfStudy、cat 分类
- 规模目标:目标条数
- 输出语言:中文
- 类型偏好:是否只要 conference/期刊、是否只要 2024 年后等硬条件
输出语言决策:
- - 如果我的查询包含“中文”“用中文”“中文回答”“总结成中文”等词 -> 强制全部输出中文。
- 如果我的查询是纯英文或学术术语为主 -> 保持论文标题/作者/会议期刊原文,分析描述用中文。
- 其他情况默认中文,并在描述字段中保持中文表达。
2) 可用的搜索引擎与使用
arxiv搜索引擎
功能概述
面向 arXiv 预印本的统一检索入口,支持关键词/作者/分类/时间过滤、ID 精确拉取、分页、排序。
典型用途:
- - 追踪最新预印本(按提交时间倒序)
- 按学科/作者做前沿扫描
- 用 arXiv ID 快速获取单篇或多篇元数据(标题、摘要、作者、PDF链接等)
核心参数速查(建议优先掌握这6个,覆盖 95% 场景)
| 参数 | 作用 | 常用值/格式示例 | 必填 | 建议/约束 |
|---|
| INLINECODE15 | 查询表达式(标题/作者/摘要/分类/全字段) | INLINECODE16 <br> |