返回顶部
h

hair-cam-anno

安防摄像头视频 VL 模型微调数据集标注工具。用于从安防摄像头视频中提取关键帧、分析视频内容、生成结构化标注(含环境/人物/行为/风险描述),并输出符合 dataset.jsonl 格式的微调训练数据。Use when 用户需要对安防摄像头视频进行数据标注、生成 VL 模型训练数据集、处理 /root/hair-cam 目录下的视频数据,或提及 "hair-cam"、"数据标注"、"视频标注"、"VL模型微调"。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
126
下载量
1
收藏
概述
安装方式
版本历史

hair-cam-anno

# hair-cam-anno — 安防摄像头视频标注 对安防摄像头拍摄的视频进行帧提取、视觉分析、结构化标注,输出 `dataset.jsonl` 格式的 VL 模型微调数据集。 ## 工作流程 ### 第1步:提取视频帧 ```bash python3 <skill>/scripts/extract_frames.py \ --data-dir <视频目录> \ --output-dir <帧输出目录> \ --fps 0.5 \ --max-frames 4 ``` - 从每个视频均匀提取 4 帧(每2秒一帧) - 生成 `manifest.json` 记录每个视频的元信息和帧路径 ### 第2步:逐视频分析标注 对每个视频: 1. **查看提取的帧**:用 `read` 工具读取帧图片(支持 jpg/png) 2. **从文件名推断信息**:文件名包含关键信息(如 `海尔摄像头-1男1女-坐-2` → 品牌=海尔摄像头, 1男1女, 行为=坐) 3. **生成标注 JSON**:根据帧画面内容 + 文件名信息,生成结构化标注 标注 JSON 结构: ```json { "title": "场景标题", "subtitle": "场景副标题", "description": "详细描述(≥50字,含环境、人物外貌、行为姿态)", "labels": ["system_suggest_X", ...], "risk": { "level": "none|low|medium|high", "description": "风险描述" }, "simple_description": "简练描述(≤20汉字)" } ``` ### 第3步:汇总生成 dataset.jsonl 1. 将所有标注结果收集到 `annotations.json`,格式: ```json [ {"video": "文件名.mp4", "annotation": { ...标注JSON... }}, ... ] ``` 2. 运行构建脚本: ```bash python3 <skill>/scripts/build_jsonl.py \ --annotations annotations.json \ --video-dir <视频目录> \ --output dataset.jsonl ``` 3. 脚本会自动验证标注数据并生成 `dataset.jsonl` ## 关键参考 - **System prompt 模板**: `references/system-prompt.md` - **标签范围**: `references/labels-reference.md` ## 标签选择规则 - 根据视频实际内容选择匹配标签 - 可多选,但不要选不匹配的标签 - 如果视频中有危险行为(儿童攀爬窗户、摔倒等),risk.level 应为 medium 或 high - 文件名中的信息(人数、行为)必须与标注一致

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 sjht-cam-anno-1776214083 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 sjht-cam-anno-1776214083 技能

通过命令行安装

skillhub install sjht-cam-anno-1776214083

下载 Zip 包

⬇ 下载 hair-cam-anno v1.0.0

文件大小: 9.66 KB | 发布时间: 2026-4-17 16:07

v1.0.0 最新 2026-4-17 16:07
# Changelog — hair-cam-anno

所有格式基于 [Keep a Changelog](https://keepachangelog.com/zh-CN/1.1.0/),
版本号遵循 [语义化版本](https://semver.org/lang/zh-CN/)。

---

## [0.1.0] — 2026-03-18

### 新增
- 初始版本发布
- **视频帧提取脚本** `scripts/extract_frames.py`
- 基于 ffmpeg,支持 mp4/avi/mkv/mov/flv/wmv/webm 格式
- 可配置提取帧率(默认 0.5 fps)和每视频最大帧数(默认 4 帧)
- 自动生成 `manifest.json`(含视频元信息:分辨率、时长、帧数、编码格式)
- **dataset.jsonl 构建脚本** `scripts/build_jsonl.py`
- 读取 `annotations.json`,生成符合 VL 模型微调规范的 `dataset.jsonl`
- 内置自动验证:字段完整性、标签合法性、风险等级合法性、simple_description 长度(≤20字)、description 长度(≥50字)
- **System Prompt 模板** `references/system-prompt.md`
- 定义 VL 模型角色、6 步分析流程、JSON 输出格式约束
- 包含 15 个预定义场景标签(system_suggest_0 ~ system_suggest_14)
- 风险等级:none / low / medium / high
- **标签与风险等级参考** `references/labels-reference.md`
- 15 个标签定义与含义说明
- 4 级风险等级定义及典型场景
- 数据集类别要求(物体/行为动作/环境)数量标准
- **SKILL.md** 技能主文件
- 三步工作流程:帧提取 → 逐视频分析标注 → 汇总生成 dataset.jsonl
- 标签选择规则指导

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部