返回顶部
d

dual-disease-transcriptomic-ml-planner双病转录ML规划器

Generates complete dual-disease transcriptomic + machine learning research designs from a user-provided disease pair. Use when users want to identify shared DEGs, common hub genes, cross-disease biomarkers, or shared molecular mechanisms between two diseases using public GEO data. Triggers: "shared biomarker study for two diseases", "dual-disease transcriptomic ML paper", "identify common DEGs between disease A and B", "cross-disease hub gene discovery", "shared DEG + PPI + ROC design", "immune

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
234
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

dual-disease-transcriptomic-ml-planner

双疾病转录组机器学习研究规划器

根据用户提供的疾病对生成完整的双疾病转录组+机器学习研究设计。始终输出四种工作负载配置和一个推荐的主要方案。

支持的研究类型

类型描述示例
A. 共享DEG→核心枢纽基因DEG重叠→PPI→枢纽共识颅内动脉瘤+腹主动脉瘤;糖尿病肾病+高血压肾病
B. 双疾病共享机制
通路水平汇聚 | ECM、炎症、纤维化连接两种疾病 | | C. PPI+多算法枢纽基因优先排序 | STRING+MCODE+CytoHubba共识 | 任何具有足够共享DEG的疾病对 | | D. 双疾病生物标志物验证 | 发现队列+验证队列ROC | 每种疾病≥2个GEO数据集的任何疾病对 | | E. 免疫浸润+共享生物标志物 | CIBERSORT/替代方案+基因-免疫相关性 | 免疫活性疾病对 | | F. 单基因跨疾病深度分析 | 两种疾病中的枢纽基因GSEA | 具有强AUC的单个顶级枢纽基因 | | G. 面向发表的一体化设计 | 完整流程:DEG→PPI→ROC→免疫→GSEA | 高影响力投稿目标 |

最低用户输入

  • - 两种疾病或表型
  • 如果提供的细节有限,推断合理的默认设计并明确说明所有假设(硬规则9)

逐步执行

步骤1:推断研究类型

识别:

  • - 疾病对及生物学主题(血管、自身免疫、纤维化、代谢、神经退行性、感染-肿瘤、共病)
  • 用户目标:共享生物标志物、共享机制、免疫相关性或发表强度
  • ML是核心(枢纽共识、ROC)还是辅助(生物学解释)
  • 免疫分析是否合适——参考硬规则5及下方组织/工具决策指南
  • 资源限制:仅公共数据、每种疾病数据集数量、时间限制、单基因聚焦

步骤2:输出四种配置

始终生成全部四种。对每种配置描述:目标、所需数据、主要模块、预期工作量、图表集、优势、劣势。

配置目标时间框架最适合
精简版共享DEG+基础枢纽,每种疾病1个数据集2–4周预实验、骨架稿件、单数据集限制
标准版
完整流程+验证+ROC+一个深化层 | 5–9周 | 核心可发表论文 |
| 高级版 | 标准版+免疫+GSEA+多队列稳健性 | 9–14周 | 竞争性期刊目标 |
| 发表+版 | 完整多层+实验建议+审稿人防御 | 12–20周 | 高影响力投稿 |

步骤3:推荐一个主要方案

选择最合适的配置并解释原因,考虑疾病对生物学、GEO数据可用性、时间限制和发表目标。

步骤4:完整逐步工作流程

对每个步骤包括:步骤名称、目的、输入、方法、关键参数/阈值、预期输出、失败点、替代方法。

数据集与预处理

  • - GEO数据集搜索:每种疾病尽可能包含一个发现队列+一个验证队列(参见references/geosearchand_tools.md
  • 仅组织过滤:排除血液/脑脊液,除非疾病适用;匹配两种疾病的组织类型
  • 组织选择规则:使用最接近疾病病理学的组织;对于代谢疾病,参考组织/工具决策指南
  • 平台兼容性检查:在合并前验证GPL ID匹配或可交叉兼容
  • 标准化;不强制合并但考虑批次效应
  • 疾病与对照组分配

容错——数据集层面:

  • - 如果一种疾病不存在GEO数据集:声明不可行,建议最接近的可用代理表型,降级为仅发现设计的精简版
  • 如果每种疾病仅有一个数据集可用:降级为精简版;明确说明验证ROC不可行;提供第二个队列的GEO搜索策略

DEG与共享特征

  • - 基于limma的DEG分析(logFC > 1–2,adj.p < 0.05)
  • 火山图、热图
  • 共享上/下调DEG交集(韦恩图)
  • 共享基因汇总表

容错——DEG交集:

  • - 如果共享DEG计数=0:不进行PPI/枢纽分析;按顺序应用以下恢复序列:

1. 将logFC阈值放宽至0.5(与原始结果一起报告)
2. 无论阈值如何,扩展至每种疾病前500个DEG
3. 切换至WGCNA共表达模块重叠而非直接DEG交集
4. 重新评估疾病对是否共享共同组织或生物学机制;如果不是,建议替代配对

富集与共享机制

  • - GO富集(BP、MF、CC)+ KEGG富集(clusterProfiler / DAVID)
  • 通路可视化;共享生物学模块总结

PPI与枢纽优先排序

  • - STRING PPI构建(置信度评分 > 0.4)
  • Cytoscape可视化;MCODE密集簇识别
  • CytoHubba多算法排名(需要≥5种算法:Degree、MCC、Betweenness、Closeness、EPC)
  • 枢纽基因共识逻辑→前1/前3/前10候选基因

生物标志物性能

  • - ROC / AUC分析(pROC);AUC > 0.70为最低阈值
  • 发现队列ROC + 验证队列ROC(标准版及以上)
  • 跨队列表达验证

容错——ROC:

  • - 如果发现队列中AUC ≈ 0.5:不解释为生物标志物;标记为无信息;考虑迷你特征(3-5个基因)而非单个枢纽基因
  • 如果每组n < 30:明确标记AUC膨胀风险;使用自举CI解释AUC;不进行泛化

免疫浸润(当疾病适用时,依据硬规则5)

  • - 反卷积工具选择——参考references/tissueandtool_decisions.md根据组织类型选择正确工具
  • 免疫细胞比例比较(疾病vs对照);基因-免疫细胞相关性(Spearman)
  • 小提琴图、棒棒糖图/热图相关性

单基因深化(标准版及以上)

  • - 按枢纽基因表达分层样本(高vs低四分位)
  • 两种疾病中的单基因GSEA;跨疾病通路汇聚解释

步骤5:图表计划

→ 完整图表列表和表格模板:references/figureplan_template.md

核心图表:工作流程示意图(图1)、DEG火山图+韦恩图(图2)、共享DEG热图(图3)、GO/KEGG富集(图4)、PPI+MCODE+枢纽排名(图5)、ROC曲线(图6)、免疫浸润+相关性(图7)、单基因GSEA(图8)。表格:数据集汇总、共享DEG列表、枢纽排名、ROC/AUC汇总。

步骤6:验证与稳健性计划

说明每层证明的内容和未证明的内容:

  • - 共享表达证据——DEG重叠+阈值可重复性
  • 枢纽优先排序证据——PPI拓扑+多算法共识(关联性,非因果性)
  • 生物标志物性能证据——发现队列+验证队列中的ROC/AUC(诊断信号,非机制证明)
  • 免疫支持——免疫景观差异+基因-免疫相关性(仅关联性;硬规则8)
  • 单基因机制支持——GSEA通路主题(仅产生假设;硬规则7)

步骤7:风险评估

始终包含自我批评部分,涉及:

  • - 设计中最强的部分
  • 最依赖假设的部分(通常:小队列ROC膨胀;跨数据集平台差异)
  • 最可能的假阳性来源(共享DEG少时的枢纽排名;n < 50时AUC > 0.9)
  • 最容易过度解释的部分(将免疫反卷积视为因果;将一个枢纽基因视为机制证明)
  • 最可能的审稿人批评:小队列、无实验验证、平台异质性、单一生物标志物过度解释、免疫反卷积局限性、CRC/传染病亚型异质性
  • 如果首次发现失败时的修订策略(放宽DEG阈值、替代验证队列、切换至迷你特征)

步骤8:最小可执行版本

仅公共数据,每种疾病一个发现数据集,DEG+韦恩图+GO/KEGG,STRING+MCODE+CytoHubba顶级基因,发现队列ROC,一页解释。2-4周时间线。在推荐前确认与任何规定时间或数据集约束的可行性。

步骤9:发表升级路径

→ 完整升级影响表:references/upgrade_path.md

按影响的关键升级:每种疾病的验证队列(高/

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 dual-disease-transcriptomic-ml-planner-1776108139 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 dual-disease-transcriptomic-ml-planner-1776108139 技能

通过命令行安装

skillhub install dual-disease-transcriptomic-ml-planner-1776108139

下载

⬇ 下载 dual-disease-transcriptomic-ml-planner v0.1.0(免费)

文件大小: 15.64 KB | 发布时间: 2026-4-15 12:35

v0.1.0 最新 2026-4-15 12:35
Initial release of **dual-disease-transcriptomic-ml-planner** — a research design generator for shared transcriptomic and machine learning studies of any disease pair.

- Generates four workload configurations (Lite, Standard, Advanced, Publication+) for every inquiry
- Provides recommended study plan, step-by-step workflow, figure plan, validation strategy, and upgrade path
- Supports diverse dual-disease ML/transcriptomics analyses: shared DEGs, hub genes, biomarkers, immunity, and mechanisms via public GEO datasets
- Built-in fault tolerance for data/resource limitations, and explicit handling of study design assumptions
- Modular, publication-oriented outputs suitable for both quick pilot studies and high-impact journal targets

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部