返回顶部
n

natural-language-video-search自然语言视频搜索

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.2.3
安全检测
已通过
215
下载量
免费
免费
6
收藏
概述
安装方式
版本历史

natural-language-video-search

自然语言视频搜索

使用由Gemini Embedding 2原生视频转向量嵌入技术驱动的自然语言查询来搜索视频文件。

该技能的功能

该技能允许你将视频文件(行车记录仪录像、安防摄像头录制、任何mp4文件)索引到本地向量数据库中,然后通过用自然语言描述你要查找的内容来搜索它们。匹配度最高的结果会自动裁剪并保存为片段。

对于特斯拉行车记录仪录像,可选的遥测叠加功能可以将速度、GPS、位置和转向灯数据烧录到裁剪后的片段上。

设置

需要uv和Python 3.11+。

  1. 1. 克隆并安装:

bash
git clone https://github.com/ssrajadh/sentrysearch.git
cd sentrysearch
uv sync

如需特斯拉叠加支持(反向地理编码):

bash
uv sync --extra tesla

  1. 2. 设置你的Gemini API密钥:

bash
sentrysearch init

这会提示输入你的密钥,将其写入.env文件,并通过测试嵌入进行验证。你也可以直接将GEMINIAPIKEY设置为环境变量。

命令

索引视频文件

bash
sentrysearch index <目录或文件>

选项:--chunk-duration(默认30秒),--overlap(默认5秒),--no-preprocess,--target-resolution,--target-fps,--skip-still / --no-skip-still,--verbose

搜索已索引的录像

bash
sentrysearch search <自然语言查询>

选项:-n / --results(默认5),-o / --output-dir,--trim / --no-trim,--threshold(默认0.41),--overlay / --no-overlay(特斯拉遥测),--verbose

应用特斯拉遥测叠加

bash
sentrysearch overlay <视频文件>
sentrysearch overlay <视频文件> -o output.mp4

在特斯拉行车记录仪视频上烧录HUD叠加层,显示速度、GPS坐标、位置名称和转向灯状态。从特斯拉固件2025.44.25+中嵌入的SEI NAL单元读取遥测数据。也可作为搜索命令上的--overlay标志使用,自动叠加裁剪后的片段。

查看索引统计

bash
sentrysearch stats

工作原理

视频文件被分割成重叠的片段。静态帧检测可以跳过没有明显视觉变化的片段,从而消除不必要的API调用——这是哨兵模式或安防摄像头等空闲录像的主要成本节省方式。片段还会进行预处理(降低帧率和分辨率)以减小上传大小并加快传输速度,不过Gemini API按固定令牌率根据视频时长计费,而非文件大小,因此预处理不会降低每个片段的令牌成本。每个片段使用Gemini Embedding 2作为原始视频进行嵌入(无需转录或字幕)。向量存储在本地ChromaDB数据库中。文本查询被嵌入到相同的向量空间中,并通过余弦相似度进行匹配。匹配度最高的结果通过ffmpeg从原始文件中自动裁剪。

何时使用该技能

  • - 用户要求搜索视频文件或录像
  • 用户想通过描述来查找视频中的特定时刻
  • 用户要求索引或整理视频录像以便搜索
  • 用户提到行车记录仪、安防摄像头或监控片段
  • 用户想从较长的视频中查找并提取片段
  • 用户有特斯拉行车记录仪录像,并希望在片段上叠加速度/GPS/位置信息
  • 用户想对特斯拉视频应用遥测叠加

交互示例

用户:搜索我的行车记录仪录像,找一辆白色卡车别我
操作:运行 sentrysearch search white truck cutting me off

用户:索引我下载文件夹中的所有视频文件
操作:运行 sentrysearch index ~/Downloads

用户:搜索闯红灯,并在片段上包含特斯拉叠加信息
操作:运行 sentrysearch search running a red light --overlay

用户:给这个特斯拉视频添加速度和GPS叠加信息
操作:运行 sentrysearch overlay /path/to/tesla_video.mp4

用户:我索引了多少录像?
操作:运行 sentrysearch stats

规则

  • - 在索引或搜索之前,始终运行sentrysearch init或确认GEMINIAPIKEY已设置。
  • 如果在PATH中找不到ffmpeg,将自动使用捆绑的imageio-ffmpeg回退方案。
  • 使用默认设置,索引活跃录像的成本约为每小时2.84美元。成本由发送到API的片段数量决定——长时间空闲的录像(哨兵模式、安防摄像头)将显著更便宜,因为静态帧跳过会完全消除这些片段。在索引大型目录之前警告用户。
  • 搜索结果包含相似度分数。低于阈值(默认0.41)的分数会在裁剪前触发低置信度提示。
  • 特斯拉叠加需要固件2025.44.25+以获取SEI元数据。没有特斯拉元数据的视频将优雅地跳过叠加。
  • 需要Python 3.11+。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 natural-language-video-search-1776079321 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 natural-language-video-search-1776079321 技能

通过命令行安装

skillhub install natural-language-video-search-1776079321

下载

⬇ 下载 natural-language-video-search v0.2.3(免费)

文件大小: 2.96 KB | 发布时间: 2026-4-14 14:24

v0.2.3 最新 2026-4-14 14:24
Added local model support, Tesla metadata overlay, similarity threshold, switched to uv

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部