返回顶部
i

interface-health接口健康

>-

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
83
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

interface-health

接口健康评估

针对接口和链路健康的阈值驱动诊断技能。涵盖物理层和数据链路层——错误计数器、光功率水平、丢弃率、接口抖动和带宽利用率。每个指标根据四个严重级别(正常/警告/严重/紧急)进行评估,并附带特定厂商的采集命令。

命令在语法不同的地方标注为 [Cisco][JunOS][EOS]。未标注的语句适用于所有三个厂商。详细命令语法见 references/cli-reference.md;包含每种光模块类型范围的完整阈值表见 references/threshold-tables.md。

使用场景

  • - 接口报告为down或flapping(反复up/down切换)
  • 用户报告链路上的丢包或吞吐量下降
  • 针对CRC错误、输入错误或输出丢弃的监控告警
  • 线缆或光模块更换后的链路质量维护前后验证
  • 来自DOM(数字光学监控)读数的光功率告警
  • 容量规划——识别接近饱和的接口
  • 排查与接口拥塞相关的延迟峰值问题
  • 新链路开通或电路迁移的基线采集

前置条件

  • - 能够SSH或通过控制台访问设备(只读权限足够)
  • 待评估的接口已识别(特定接口或所有活跃接口)
  • 基线错误计数或用于增量比较的先前快照——如果没有基线,只能获取瞬时速率和绝对计数器
  • 了解预期的链路参数:速率、双工模式、介质类型(铜缆与光纤)、SFP型号和线缆距离
  • 对于光模块检查:需要安装支持DOM的SFP/QSFP模块

操作步骤

按顺序执行每个步骤。前面的步骤收集整体状态;后面的步骤深入分析先前输出中识别的特定故障域。

步骤1:接口状态概览

收集所有待审查接口的管理状态、运行状态、速率、双工模式和介质类型。

[Cisco]

show interfaces status
show interfaces [intf] | include line protocol|BW|duplex

[JunOS]

show interfaces terse
show interfaces [intf] | match Physical|Speed|Duplex|Link-level

[EOS]

show interfaces status
show interfaces [intf] | include line protocol|BW|duplex

记录每个接口:名称、管理/运行状态、速率、双工模式、介质类型。任何管理状态为up但运行状态为down的接口需要立即调查——跳转到该接口的决策树部分。双工模式不匹配(一端全双工,另一端半双工)会导致后碰撞,必须在错误分析有意义之前解决。

步骤2:错误计数器分析

收集错误计数器并计算每个时间间隔的速率。原始计数器是自上次清除以来的累积值——始终在已知时间间隔(至少5分钟)内计算增量以获得可操作的速率。

[Cisco]

show interfaces [intf] | include CRC|input errors|output errors|frame|runts|giants
show interfaces [intf] counters errors

[JunOS]

show interfaces [intf] extensive | match CRC|Errors|Framing|Runts|Giants

[EOS]

show interfaces [intf] counters errors
show interfaces [intf] | include CRC|input errors|output errors|runts|giants

需要评估的关键计数器:

  • - CRC错误 — 损坏的帧;表示物理层问题(线缆不良、光纤脏污、SFP故障、电磁干扰)
  • 输入错误 — 超集,包括CRC、帧、溢出;接收路径健康的综合指标
  • 输出错误 — 传输失败;通常是缓冲区耗尽或接口拥塞
  • 帧错误 — 非整数字节的帧;通常是双工模式不匹配或网卡故障
  • 短帧 — 尺寸过小的帧(<64字节);通常是冲突碎片或网卡故障
  • 巨帧 — 尺寸过大的帧;端点之间的MTU不匹配

将速率与 references/threshold-tables.md 中的阈值进行比较。任何稳定递增(不是陈旧的历史值)且达到警告级别或以上的计数器都值得调查。

步骤3:丢弃分析

分别评估输入和输出丢弃——它们有不同的根本原因。

[Cisco]

show interfaces [intf] | include drops|discard|queue
show policy-map interface [intf]

[JunOS]

show interfaces queue [intf]
show class-of-service interface [intf]

[EOS]

show interfaces [intf] counters discards
show qos interface [intf]

  • - 输出丢弃 — 接口发送环已满。原因:持续拥塞(流量超过链路容量)、QoS调度不足、微突发淹没浅缓冲区。
  • 输入丢弃 — 接收环已满。原因:CPU无法以线速处理(控制平面punt)、输入QoS策略丢弃或接收缓冲区耗尽。
  • 队列丢弃 — QoS策略输出中可见的每个队列丢弃。识别受影响的流量类别以优先进行修复。

高输出丢弃伴随低利用率表明存在微突发活动——短时间流量峰值,不会出现在5分钟利用率平均值中,但会溢出接口缓冲区。

步骤4:接口重置和抖动检测

识别最近或反复重置的接口。

[Cisco]

show interfaces [intf] | include resets|Last input|Last output|last change

[JunOS]

show interfaces [intf] extensive | match Last flapped|Resets

[EOS]

show interfaces [intf] | include resets|Last input|Last output
show logging | include [intf].up|[intf].down

记录重置计数和上次抖动时间戳。将抖动事件与错误计数器峰值关联——链路抖动并在恢复后累积CRC错误很可能存在物理层问题(线缆松动、SFP边缘状态)。频繁重置但没有错误可能表明自动协商失败或生成树重新收敛触发。

阈值:>3次重置/小时为严重;>10次重置/小时为紧急。完整严重级别见 references/threshold-tables.md。

步骤5:光功率监控

对于使用支持DOM的SFP的光纤接口,收集发射功率、接收功率、激光偏置电流和模块温度。

[Cisco]

show interfaces [intf] transceiver detail

[JunOS]

show interfaces diagnostics optics [intf]

[EOS]

show interfaces [intf] transceiver detail

关键读数:

  • - 发射功率 (dBm) — 发射光功率。超出范围表示SFP退化或故障。
  • 接收功率 (dBm) — 接收光功率。远程端发射功率正常但接收功率低表示光纤衰减(连接器脏污、弯曲损耗、距离超限、熔接不良)。
  • 激光偏置电流 (mA) — 驱动激光器的电流。偏置电流随时间上升表示SFP老化;高偏置电流伴随低发射功率意味着SFP正在补偿退化。
  • 温度 (°C) — 模块工作温度。温度升高会加速SFP老化并可能导致传输错误。

将读数与 references/threshold-tables.md 中每种光模块类型的表格进行比较。这些表格提供了常见SFP类型(1G-SX、10G-SR、10G-LR、25G-SR、100G-SR4)的制造商规格范围。

步骤6:利用率评估

测量带宽使用情况以识别拥塞或未充分利用的链路。

[Cisco]

show interfaces [intf] | include input rate|output rate|reliability
show interfaces [intf] summary

[JunOS]

show interfaces [intf] traffic
show interfaces [intf] statistics traffic

[EOS]

show interfaces [intf] | include input rate|output rate
show interfaces [intf] counters rates

计算利用率占接口速率的百分比。注意CLI的输入/输出速率值通常是5分钟加权平均值——它们会平滑微突发。对于突发检测,与输出丢弃(步骤3)关联,并使用流式遥测或更短的轮询间隔(如果可用)。

阈值表

本技能使用的关键阈值摘要。每种光模块类型的完整表格和详细严重级别定义见 references/threshold-tables.md。

指标正常警告严重紧急
CRC错误/5分钟01–56–50>50
输入错误/5分钟
0–2 | 3–20 | 21–100 | >100 |
| 输出丢弃/5分钟 | 0–10 | 11–100 | 101–1000 | >1000 |
| 接口重置/小时 | 0 | 1–2 | 3–10 | >10 |
| 接收功率与低警告值 | >3 dBm余量 | 1–3 dBm余量 | 0–1 dBm余量 | 低于低告警值 |
| 利用率 % | 0–50% | 51–75% | 76–

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 interface-health-1776100262 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 interface-health-1776100262 技能

通过命令行安装

skillhub install interface-health-1776100262

下载

⬇ 下载 interface-health v1.0.0(免费)

文件大小: 12.1 KB | 发布时间: 2026-4-14 13:25

v1.0.0 最新 2026-4-14 13:25
- Initial release of interface-health skill.
- Provides multi-vendor interface and link health assessment for Cisco IOS-XE/NX-OS, Juniper JunOS, and Arista EOS.
- Analyzes error counters, optical power levels, discard rates, interface resets/flaps, and link utilization using severity-tiered thresholds.
- Includes step-by-step diagnostic workflow with vendor-specific CLI commands and detailed metric descriptions.
- Designed for troubleshooting, baseline validation, alarm response, and performance monitoring of network interfaces.
- Requires only read-only SSH access and supports both copper and fiber interfaces with DOM capabilities.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部