返回顶部
c

clinical-data-cleaner临床数据清洗

Use when cleaning clinical trial data, preparing data for FDA/EMA submission, standardizing SDTM datasets, handling missing values in clinical studies, detecting outliers in lab results, or converting raw CRF data to CDISC format. Cleans and standardizes clinical trial data for regulatory compliance with audit trails.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.1
安全检测
已通过
348
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

clinical-data-cleaner

临床数据清理器

清理、验证并标准化临床试验数据,使其符合CDISC SDTM标准,以便向FDA或EMA提交监管申请。

快速开始

python
from scripts.main import ClinicalDataCleaner

初始化人口学领域

cleaner = ClinicalDataCleaner(domain=DM)

使用默认设置清理数据

cleaned = cleaner.clean(raw_data)

保存并附带审计追踪

cleaner.save_report(output.csv)

核心功能

1. SDTM领域验证

python
cleaner = ClinicalDataCleaner(domain=DM) # 或 LB, VS
isvalid, missing = cleaner.validatedomain(data)

必填字段:

  • - DM:STUDYID、USUBJID、SUBJID、RFSTDTC、RFENDTC、SITEID、AGE、SEX、RACE
  • LB:STUDYID、USUBJID、LBTESTCD、LBCAT、LBORRES、LBORRESU、LBSTRESC、LBDTC
  • VS:STUDYID、USUBJID、VSTESTCD、VSORRES、VSORRESU、VSSTRESC、VSDTC

2. 缺失值处理

python
cleaner = ClinicalDataCleaner(
domain=DM,
missing_strategy=median # mean、median、mode、forward、drop
)
cleaned = cleaner.handlemissingvalues(data)

3. 异常值检测

python
cleaner = ClinicalDataCleaner(
domain=LB,
outlier_method=domain, # iqr、zscore、domain
outlier_action=flag # flag、remove、cap
)
flagged = cleaner.detect_outliers(data)

临床阈值:

参数范围单位
葡萄糖50-500mg/dL
血红蛋白
5-20 | g/dL |
| 收缩压 | 70-220 | mmHg |

4. 日期标准化

python
standardized = cleaner.standardize_dates(data)

转换为ISO 8601格式:2023-01-15T09:30:00

5. 完整流程

python
cleaner = ClinicalDataCleaner(
domain=DM,
missing_strategy=median,
outlier_method=iqr,
outlier_action=flag
)
cleaned_data = cleaner.clean(data)
cleaner.save_report(output.csv)

输出文件:

  • - output.csv - 清理后的SDTM数据
  • output.report.json - 用于监管提交的审计追踪

命令行使用

bash

清理人口学数据


python scripts/main.py \
--input dm_raw.csv \
--domain DM \
--output dm_clean.csv \
--missing-strategy median \
--outlier-method iqr \
--outlier-action flag

使用临床阈值清理实验室数据

python scripts/main.py \ --input lb_raw.csv \ --domain LB \ --output lb_clean.csv \ --outlier-method domain

常见模式

详见 references/common-patterns.md 中的详细示例:

  • - 监管提交准备
  • 中期分析数据准备
  • 数据库迁移清理
  • 外部实验室数据整合

故障排除

详见 references/troubleshooting.md 中的解决方案:

  • - 验证失败
  • 日期解析错误
  • 大数据集内存错误
  • 异常值检测问题

质量检查清单

清理前:

  • - [ ] 获得IACUC批准(动物研究)
  • [ ] 样本量具有足够统计效力
  • [ ] 随机化方法已记录

清理后:

  • - [ ] 对照CDISC SDTM IG进行验证
  • [ ] 审查审计追踪中的所有清理操作
  • [ ] 测试导入分析软件

参考资料

  • - references/sdtmigguide.md - CDISC SDTM实施指南
  • references/domainspecs.json - 领域特定字段要求
  • references/outlierthresholds.json - 临床异常值阈值
  • references/common-patterns.md - 详细使用模式
  • references/troubleshooting.md - 问题解决指南

技能ID:189 | 版本:2.0 | 许可证:MIT

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 clinical-data-cleaner-1776109466 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 clinical-data-cleaner-1776109466 技能

通过命令行安装

skillhub install clinical-data-cleaner-1776109466

下载

⬇ 下载 clinical-data-cleaner v0.1.1(免费)

文件大小: 14.89 KB | 发布时间: 2026-4-15 12:11

v0.1.1 最新 2026-4-15 12:11
No changes detected in this version.

- No file or documentation updates since the previous release.
- Functionality and usage remain unchanged.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部