返回顶部
m

musa-torch-coding 音频转录工具

Transcribe audio via OpenAI Audio Transcriptions API (Whisper).

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
199
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

musa-torch-coding

MUSA Torch 编码

使用 torch_musa 生成可在摩尔线程 MUSA GPU 上运行的 PyTorch 代码的指南。

概述

MUSA(元宇宙统一系统架构)是摩尔线程的 GPU 计算平台。本技能帮助生成以下代码:

  • - 通过 torch_musa 在摩尔线程 GPU 上运行
  • 将 CUDA 代码转换为 MUSA 兼容代码
  • 设置适当的环境(conda v1.2/v1.3)
  • 遵循 MUSA 最佳实践

主要区别:CUDA vs MUSA

CUDAMUSA
torch.cudatorch.musa
torch.device(cuda)
torch.device(musa) | | torch.cuda.isavailable() | torch.musa.isavailable() | | backend=nccl | backend=mccl | | torch.cuda.devicecount() | torch.musa.devicecount() | | torch.cuda.getdevicename() | torch.musa.getdevicename() |

环境设置

⚠️ 重要提示:MUSA 使用预配置的 Conda 环境

请勿手动安装 PyTorch、vLLM 或相关包。 MUSA 环境是定制构建的,包含:

  • - MUSA 特定的 PyTorch 构建(与标准 PyTorch 不兼容)
  • MUSA 定制的 vLLM 版本
  • MUSA 驱动和 SDK 集成

从 PyPI 安装标准包会破坏环境。

Conda 环境(v1.2/v1.3)

MUSA 提供预配置的 conda 环境。常见环境名称:

  • - v1.2 - MUSA SDK v1.2 环境
  • v1.3 - MUSA SDK v1.3 环境(较新)

bash

列出可用的 MUSA 环境


conda env list | grep -E (v1\.2|v1\.3|musa)

激活适当的环境

conda activate v1.2 # 或 v1.3

验证 MUSA 可用性

python -c import torchmusa; import torch; print(torch.musa.isavailable())

环境检测与设置

如果未检测到 MUSA conda 环境:

  1. 1. 检查 MUSA 是否已安装:

bash
which musaInfo # 应显示 musaInfo 路径
ls /usr/local/musa/ # MUSA SDK 位置

  1. 2. 如果 MUSA 未设置:

- 使用 musa-env-setup 技能 进行完整环境安装
- 该技能涵盖 SDK 安装、conda 设置和 vLLM-MUSA 配置

  1. 3. 常见的 conda 环境位置:

- /opt/conda/envs/
- ~/conda/envs/
- /usr/local/conda/envs/

关键环境变量

变量用途
MUSAVISIBLEDEVICES=0,1,2,3控制可见的 GPU ID
MUSALAUNCHBLOCKING=1
同步内核启动 | | MUDNNLOGLEVEL=INFO | 启用 MUDNN 日志记录 | | TORCHSHOWCPP_STACKTRACES=1 | 显示 C++ 堆栈跟踪 |

代码生成规则

生成用于 MUSA 的 PyTorch 代码时:

  1. 1. 始终导入 torch_musa

python
import torch_musa # 使用 torch.musa 前必须导入

  1. 2. 使用 torch.device(musa)

python
device = torch.device(musa) if torch.musa.is_available() else torch.device(cpu)
tensor = torch.tensor([1.0, 2.0], device=device)

  1. 3. 分布式训练使用 mccl

python
dist.initprocessgroup(backend=mccl, ...)

  1. 4. 支持混合精度(AMP)

python
from torch.cuda.amp import autocast, GradScaler # 相同 API

  1. 5. TensorCore 优化可用

- 设置 torch.backends.musa.matmul.allow_tf32 = True 启用 TensorFloat32

模型模板

常见模型类型请参见 references/ 中的模板:

  • - reference.md - 完整的 MUSA API 参考

常见任务

检查 GPU 可用性

python
import torch
import torch_musa

print(fMUSA 可用: {torch.musa.is_available()})
print(f设备数量: {torch.musa.device_count()})
print(f设备名称: {torch.musa.getdevicename(0)})

训练循环模式

python
import torch_musa

设备设置

device = torch.device(musa) if torch.musa.is_available() else torch.device(cpu)

将模型和数据移至设备

model = model.to(device) inputs = inputs.to(device)

训练(与 CUDA 相同)

optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, targets) loss.backward() optimizer.step()

分布式训练(DDP)

python
import torch.distributed as dist
import torch_musa

使用 mccl 后端初始化

dist.initprocessgroup(backend=mccl, rank=rank, worldsize=worldsize)

在 MUSA 上创建进程组

torch.cuda.setdevice(localrank) # torch_musa 扩展了 torch.cuda API

代码转换

将现有 CUDA 代码转换为 MUSA 时:

  1. 1. 在顶部添加 import torch_musa
  2. 将设备字符串中的 cuda 替换为 musa
  3. 将分布式后端的 nccl 替换为 mccl
  4. 保持所有其他 PyTorch API 调用不变

故障排除

  • - 找不到设备:确保用户属于 render 组:sudo usermod -aG render $(whoami)
  • 找不到库:检查 LDLIBRARYPATH 是否包含 /usr/local/musa/lib/
  • 构建问题:清理并重新构建:python setup.py clean && bash build.sh
  • Docker 问题:使用 --env MTHREADSVISIBLEDEVICES=all

参考

有关详细的 API 参考和示例,请参见 references/reference.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 musa-torch-coding-1776109211 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 musa-torch-coding-1776109211 技能

通过命令行安装

skillhub install musa-torch-coding-1776109211

下载

⬇ 下载 musa-torch-coding v1.0.0(免费)

文件大小: 10.97 KB | 发布时间: 2026-4-15 13:31

v1.0.0 最新 2026-4-15 13:31
musa-torch-coding 1.0.0 – Initial release

- Provides a guide for generating PyTorch code compatible with Moore Threads (MUSA) GPUs using torch_musa.
- Documents key differences between CUDA and MUSA APIs.
- Outlines environment setup, detection, and usage of pre-configured conda environments for MUSA.
- Details code generation rules, including device selection and distributed training with mccl backend.
- Includes model templates, common code patterns, and troubleshooting tips specific to MUSA environments.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部