返回顶部
Q

QwenQwen工作流

Build and route Qwen chat, coding, reasoning, and vision workflows across hosted and self-hosted endpoints with safer debugging.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
365
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

Qwen

何时使用

用户需要Qwen在聊天、编程、推理、结构化输出或视觉任务中可靠工作。在工作流进入生产环境前,Agent负责处理表面选择、实时模型验证、托管与本地权衡以及故障恢复。

架构

内存存储在~/qwen/目录中。如果~/qwen/不存在,请运行setup.md。结构参见memory-template.md。

text
~/qwen/
├── memory.md # 状态、激活规则和部署默认设置
├── routes.md # 每种工作负载的首选路由
├── servers.md # 已知的本地或托管端点
├── experiments.md # 提示词、解析器和延迟记录
└── logs/ # 可选的可复现问题清理数据

快速参考

使用能解决阻塞问题的最小文件。

主题文件
设置流程setup.md
内存模板
memory-template.md |
| 托管和本地请求模式 | api-patterns.md |
| 工作负载路由矩阵 | routing-matrix.md |
| 托管与自托管决策 | deployment-paths.md |
| 工具调用和结构化输出防护 | tool-calling.md |
| 调试和恢复 | troubleshooting.md |

要求

  • - curl和jq用于最小端点检查
  • 托管Qwen通常需要DASHSCOPEAPIKEY
  • 自托管Qwen可使用Ollama、vLLM、SGLang或其他兼容OpenAI的服务器
  • 密钥仅保存在环境变量中

核心规则

1. 先锁定执行表面,再调整模型

  • - 首先识别真实的执行表面:阿里模型工作室托管API、其他兼容OpenAI的提供商或自托管服务器。
  • 大多数Qwen问题实际上是端点、区域、服务器或聊天模板问题,而非模型质量问题。

2. 在指定任何模型前先验证实时可用性

  • - 从/models或等效健康检查开始,从响应中复制实时模型ID。
  • 切勿依赖过时的截图、旧博客文章或记忆中的ID进行生产路由。

3. 按工作负载路由,而非品牌偏好

  • - 将请求拆分为以下路径之一:快速聊天、深度推理、编程代理、确定性JSON或视觉任务。
  • 选择能可靠完成该任务的最小Qwen系列和服务器路径。

4. 将结构化输出视为独立的可靠性问题

  • - 如果Qwen用于工具调用、JSON生成或下游写入,在操作前使用严格模式、低温度和解析器验证。
  • 如果第一轮是创意性或推理密集型任务,添加第二轮确定性标准化处理,而非强制一个提示词同时完成两项任务。

5. 区分模型问题与服务器问题

  • - 迁移后行为发生变化时,隔离变量:模型系列、量化、聊天模板、推理模式、解析器或后端。
  • 在同时更改提示词、基础设施和业务逻辑之前,先用一个最小负载进行复现。

6. 明确比较托管与自托管

  • - 托管Qwen通常在首次成功速度和托管多模态访问方面占优。
  • 自托管Qwen仅在隐私、本地成本控制或离线使用的优势明显超过运维开销时胜出。

7. 创建持久状态前先询问

  • - 默认以无状态方式工作。
  • 仅在用户希望跨Qwen任务保持连续性后,才创建~/qwen/笔记、保存的路由或可复现日志。

常见陷阱

  • - 将Qwen视为可互换的单一实体 -> 托管API、Ollama、vLLM和代理框架的行为各不相同。
  • 硬编码过时的模型ID -> 区域和发布节奏会使旧ID快速失效。
  • 将自由形式推理与严格JSON输出混合 -> 当一个提示词被要求同时完成两项任务时,解析会失败。
  • 将本地速度慢归咎于模型 -> Apple Silicon和Ollama常因模型大小、量化或上下文过大而失败。
  • 从不重新检查工具调用的兼容OpenAI后端迁移 -> 解析器和聊天模板差异可能破坏自动化。

外部端点

仅使用能回答当前问题的最小托管端点。

端点发送数据用途
https://dashscope.aliyuncs.com/compatible-mode/v1/models仅认证头中国大陆模型发现
https://dashscope-intl.aliyuncs.com/compatible-mode/v1/models
仅认证头 | 国际模型发现 |
| https://dashscope-us.aliyuncs.com/compatible-mode/v1/models | 仅认证头 | 美国模型发现 |
| https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions | 提示消息和选项 | 北京区域托管Qwen聊天补全 |
| https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions | 提示消息和选项 | 新加坡区域托管Qwen聊天补全 |
| https://dashscope-us.aliyuncs.com/compatible-mode/v1/chat/completions | 提示消息和选项 | 弗吉尼亚区域托管Qwen聊天补全 |

不向外部发送其他数据。

安全与隐私

离开您机器的数据:

  • - 使用托管Qwen时发送给阿里云模型工作室的提示内容
  • 请求时发送给托管Qwen视觉端点的可选图像或多模态负载

保留在本地数据:

  • - 用户批准后存储在~/qwen/中的部署偏好和路由笔记
  • 用于调试的本地服务器URL、工作负载笔记和清理后的可复现负载

此技能不会:

  • - 在markdown文件中存储API密钥
  • 向未声明的第三方端点发送数据
  • 假设本地服务器可安全公开暴露
  • 修改自身的技能文件

范围

此技能仅:

  • - 在托管和自托管执行表面之间路由Qwen工作
  • 为聊天、编程、推理、视觉和自动化选择模型系列
  • 调试迁移、解析器、延迟和端点问题
  • 仅在用户批准后存储轻量级本地笔记

此技能绝不:

  • - 未经检查就虚构模型实时可用性
  • 在~/qwen/中持久化密钥
  • 未经验证输出就执行破坏性下游自动化
  • 假设一个后端的工具调用行为适用于所有场景

信任

使用托管Qwen会将提示数据发送给阿里云模型工作室。
仅当您信任该服务处理您的数据时才安装,或保持Qwen完全自托管。

相关技能

如果用户确认,使用clawhub install 安装:
  • - models — 在将Qwen锁定到生产环境前选择模型系列和成本层级
  • api — 调试认证、负载、重试和兼容OpenAI的请求格式
  • coding — 在Qwen路由本身稳定后收紧代理编程工作流
  • chat — 在Qwen路由本身稳定后改进对话塑造
  • memory — 存储持久的路由选择和重复迁移经验

反馈

  • - 如果有用:clawhub star qwen
  • 保持更新:clawhub sync

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 qwen-1776108243 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 qwen-1776108243 技能

通过命令行安装

skillhub install qwen-1776108243

下载

⬇ 下载 Qwen v1.0.0(免费)

文件大小: 11.87 KB | 发布时间: 2026-4-15 14:05

v1.0.0 最新 2026-4-15 14:05
Initial release with hosted and self-hosted Qwen routing, API patterns, tool-calling guidance, and troubleshooting playbooks.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部