返回顶部
O

OllamaOllama模型管理

Run, tune, and troubleshoot local Ollama models with reliable API patterns, Modelfiles, embeddings, and hardware-aware deployment workflows.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
629
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

Ollama

使用时机

用户需要安装、运行、集成、调优或调试Ollama,用于本地或自托管模型工作流。Agent负责处理冒烟测试、模型选择、API使用、Modelfile定制、嵌入向量、RAG适配检查以及安全操作。

当阻塞问题特定于本地运行时行为时,使用此技能而非通用AI建议:错误的模型标签、损坏的JSON输出、检索效果差、推理速度慢、上下文窗口大小、GPU回退或不安全的远程暴露。

架构

内存数据存储在~/ollama/目录中。如果~/ollama/不存在,请运行setup.md。结构参见memory-template.md。

text
~/ollama/
|-- memory.md # 持久化上下文和激活边界
|-- environment.md # 主机、GPU、操作系统、运行时和服务记录
|-- model-registry.md # 已批准的模型、标签、量化版本和适配记录
|-- modelfiles.md # 可复用的Modelfile模式和参数决策
|-- rag-notes.md # 嵌入向量选择、分块策略、检索检查、向量维度
-- incident-log.md # 重复失败、修复方案和回滚记录

快速参考

仅加载当前阻塞问题所需的文件。

主题文件
安装指南setup.md
内存模板
memory-template.md |
| 安装和冒烟测试工作流 | install-and-smoke-test.md |
| 本地API和OpenAI兼容模式 | api-patterns.md |
| Modelfile创建和上下文控制 | modelfile-workflows.md |
| 嵌入向量和本地RAG检查 | embeddings-and-rag.md |
| 运行时操作和性能调优 | operations-and-performance.md |
| 故障恢复和事件排查 | troubleshooting.md |

要求

  • - 目标机器上具有本地ollama访问权限,或有权指导安装。
  • 足够的RAM、VRAM和磁盘空间,用于所提议的特定模型和上下文窗口。
  • 在将Ollama暴露到localhost之外、更改服务管理器或删除模型文件之前,需获得用户明确批准。
  • 必须通过实时命令(如ollama list、ollama ps和ollama show)验证确切的模型标签和运行时事实。

切勿仅凭内存数据假设模型能力、上下文长度、量化方式或GPU使用情况。

操作范围

此技能用于实际的Ollama执行,而非抽象的本地LLM讨论。涵盖范围包括:

  • - 在macOS、Linux和Windows上的本地安装
  • pull、run、copy、show、create和remove的CLI工作流
  • 在http://127.0.0.1:11434/api上的REST API使用以及在/v1上的OpenAI兼容使用
  • 硬件感知的模型大小选择、上下文调优和吞吐量权衡
  • 基于Modelfile的提示词、参数、适配器和可复现模型名称定制
  • 嵌入向量和本地RAG流水线,确保索引、查询和检索保持一致

数据存储

仅在~/ollama/中保留持久的操作上下文:

  • - 会实质性改变建议的主机事实:操作系统、GPU类型、仅CPU限制、服务管理器、远程或本地部署
  • 经批准的模型标签、复制的别名、量化选择以及实际有效的上下文限制
  • Modelfile默认值、JSON输出模式和安全的OpenAI兼容映射
  • 嵌入模型选择、向量维度、分块默认值和检索检查
  • 重复出现的故障,如部分拉取、CPU回退、端口冲突或升级损坏

核心规则

1. 在给出建议前验证运行时

  • - 在提出任何更深层次的修复之前,确认ollama已安装且可访问。
  • 从最小的事实检查开始:ollama --version、ollama list、ollama ps以及一次最小生成或/api/tags请求。
  • 将它能运行和它能正确运行视为不同状态。

2. 锁定确切的模型名称并实时检查

  • - 对于任何可复现或接近生产环境的内容,使用确切的标签,而非模糊的系列名称。
  • 在声称上下文长度、量化方式或能力之前,使用ollama show或/api/show检查实际模型。
  • 当稳定性至关重要时,避免浮动标签导致的静默漂移。

3. 分离运行时、Modelfile和应用提示词的责任

  • - 分层调试本地行为:先检查运行时,然后是模型定义,最后是应用提示词。
  • 如果输出质量发生变化,检查Modelfile中的SYSTEM、TEMPLATE或PARAMETER设置是否与应用提示词冲突。
  • 将持久的默认值放在命名模型中,而非临时复制粘贴的提示词中。

4. 根据硬件和延迟预算选择模型

  • - 技术上能加载但回退到CPU或交换内存的模型并非合适选择。
  • 在承诺性能之前,使用ollama ps确认处理器分配情况。
  • 为聊天、编码、提取、视觉和嵌入向量分别保留不同的默认值,而非强制一个模型完成所有任务。

5. 使API和结构化输出流程具有确定性

  • - 当下一步需要严格解析时,优先使用非流式响应。
  • 使用format: json或JSON schema,设置低温度,并在执行下游操作前验证解析结果。
  • 对于OpenAI兼容的客户端,验证/v1的假设,而非假设每个功能都是一一对应的。

6. 将嵌入向量和RAG视为单一系统

  • - 除非有意迁移并重新索引,否则对索引和查询使用相同的嵌入模型。
  • 在将弱答案归咎于模型之前,先检查检索到的分块内容。
  • 在增加提示词大小之前,先修复分块、元数据、top-k和向量维度问题。

7. 将远程访问和升级视为操作变更

  • - 未经明确批准和最小风险网络计划,不得将Ollama绑定到非localhost或开放端口11434。
  • 在升级之前,记录服务管理器更改、环境变量和回滚步骤。
  • 在进行大规模拉取或替换之前,保护模型存储和磁盘空间。

Ollama常见陷阱

  • - 到处使用latest -> 升级会静默改变行为并破坏可复现性。
  • 仅用ollama run测试 -> 应用集成在/api或/v1上仍然失败。
  • 假设响应慢意味着模型不好 -> 通常是CPU回退、上下文过大或磁盘压力。
  • 让应用提示词和Modelfile指令相互冲突 -> 输出变得不一致且难以调试。
  • 用一种嵌入模型重新索引,用另一种模型查询 -> 检索质量崩溃而无明显错误。
  • 在没有认证或范围限制的情况下在局域网暴露API -> 本地便利变成安全问题。
  • 在修复检索或提示词结构之前追求更大的上下文 -> 内存使用增加而答案质量几乎没有改善。

外部端点

仅在任务需要模型下载、官方文档查询或用户明确批准的可选云执行时,才使用外部网络访问。

端点发送的数据目的
https://ollama.com/*模型标识符、可选的文档查询和可选的云API请求官方文档、库查询、由Ollama运行时管理的模型拉取以及可选的云执行

不会向外部发送其他数据。

安全与隐私

离开您机器的数据:

  • - 通过Ollama拉取模型时的模型标识符和下载请求
  • 仅当用户明确选择https://ollama.com/api而非本地推理时的可选提示词和附件
  • 针对官方Ollama页面的可选文档查询

保持本地的数据:

  • - 通过用户机器上的本地Ollama运行时提供的提示词和输出
  • ~/ollama/下的持久化工作流记录
  • 本地Modelfile、检索记录和性能基线(除非用户导出)

此技能不会:

  • - 未经明确批准远程暴露Ollama
  • 在技能文件中存储OLLAMAAPIKEY或其他密钥
  • 静默混合本地和云执行
  • 编造不支持的模型功能、GPU行为或API兼容性
  • 在不事先解释风险的情况下推荐远程安装程序或破坏性清理

信任

使用此技能时,当用户明确选择这些路径时,模型拉取和可选的云请求可能会发送到Ollama基础设施。
仅当您信任Ollama处理这些数据时才安装。

范围

此技能仅:

  • - 安装、验证、操作和排查Ollama工作流
  • 帮助选择、锁定、检查和定制模型,使用可复现的模式
  • 为主机限制、模型默认值和重复故障修复保留本地内存

此技能绝不:

  • - 声称每个Ollama模型都支持相同的工具、上下文或JSON可靠性
  • 推荐将未经认证的远程暴露作为默认设置
  • 在不检查嵌入向量、分块和检索

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ollama-1776116376 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ollama-1776116376 技能

通过命令行安装

skillhub install ollama-1776116376

下载

⬇ 下载 Ollama v1.0.0(免费)

文件大小: 12.1 KB | 发布时间: 2026-4-15 13:40

v1.0.0 最新 2026-4-15 13:40
Initial release with local model setup, stable JSON output, custom model workflows, safer remote access, and recovery playbooks.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部