返回顶部
n

nccl_optimizerNCCL优化器

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.0
安全检测
已通过
99
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

nccl_optimizer

NCCL 优化器

通过清晰分离节点内节点间带宽指标,为分布式训练找到最佳的NCCL通信配置。

功能说明

  1. 1. GPU拓扑 — 使用nvidia-smi topo -m检测NVLink与PCIe连接。
  2. RDMA检测 — 通过ibvdevinfo检查PORTACTIVE状态以确认InfiniBand/RoCE。
- ✅ 支持RDMA → 输出推荐的NCCLIB*环境变量。 - ❌ 不支持RDMA → 执行套接字基准测试扫描。
  1. 3. 节点内全规约 — 遍历NCCLSOCKETIFNAME × NCCLNETGDRLEVEL × NCCLIBTIMEOUT组合,运行allreduceperf -g ,选取最佳总线带宽。
  2. 节点内P2P — 使用p2pbw测量GPU间点对点带宽(如可用)。
  3. 节点间基准测试 — 若传入nodes=参数,跨节点运行MPI allreduceperf;否则输出可执行命令。

前置条件

工具用途安装方式
nvidia-smiGPU信息与拓扑NVIDIA驱动
ibv_devinfo
RDMA检测 | apt install ibverbs-utils | | allreduceperf | 集合通信基准测试 | 见下文 | | p2p_bw | 点对点基准测试 | 同一nccl-tests构建 | | mpirun | 节点间基准测试 | apt install openmpi-bin |

构建nccl-tests

bash
git clone https://github.com/NVIDIA/nccl-tests.git
cd nccl-tests

针对V100 (sm70)、A100 (sm80)、A800 (sm80)、H100 (sm90):


make -j$(nproc) CUDA_HOME=/usr/local/cuda \
NVCCGENCODE=-gencode=arch=compute80,code=sm_80
export PATH=$PWD/build:$PATH

使用方法

bash

仅节点内测试


openclaw skill run nccl_optimizer

包含节点间基准测试(需配置免密SSH + MPI)

openclaw skill run nccl_optimizer nodes=10.0.0.1,10.0.0.2

指标说明

指标测量内容
全规约总线带宽(节点内)本地GPU间的集合通信吞吐量 — 影响单节点训练性能
P2P带宽
GPU间直接拷贝速度(NVLink ≫ PCIe) | | 全规约总线带宽(节点间) | 跨节点集合通信吞吐量 — 多节点训练的瓶颈 |

注意事项

  • - 总线带宽已按GPU数量归一化:(N-1)/N × 数据量 / 时间。需在相同N值下进行比较。
  • 多节点训练几乎总是受限于节点间带宽,而非节点内带宽。
  • RDMA(InfiniBand/RoCE)通常比TCP提供10-100倍的节点间带宽提升。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 nccl-optimizer-1776123749 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 nccl-optimizer-1776123749 技能

通过命令行安装

skillhub install nccl-optimizer-1776123749

下载

⬇ 下载 nccl_optimizer v1.1.0(免费)

文件大小: 8.99 KB | 发布时间: 2026-4-14 13:49

v1.1.0 最新 2026-4-14 13:49
Linux compatibility hardening: platform guard, container detection, robust interface scanning, fixed CUDA version parsing, distro-aware MPI install hints

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部