diepre-vision-cognition

# DiePre Vision Cognition Skill ## 元数据 | 字段 | 值 | |------------|-------------------------------| | 名称 | diepre-vision-cognition | | 版本 | 1.0.0 | | 作者 | KingOfZhao | | 发布日期 | 2026-03-31 | | 置信度 | 96% | ## 学术参考文献本视觉框架的技术路线受以下前沿研究启发： 1. **[Generating CAD Code with Vision-Language Models](https://arxiv.org/abs/2410.05340)** — VLM生成CAD代码+迭代验证（CADCodeVerify），直接升级照片→DXF管道 2. **[From 2D CAD to 3D Parametric via VLM](https://arxiv.org/abs/2412.11892)** — 2D图纸→参数化3D，解决透视矫正和参数化问题 3. **[Tool-Augmented VLLMs as Generic CAD Task Solvers](https://arxiv.org/) (ICCV 2025)** — VLLM+工具调用做通用CAD，封装OpenCV管道为可调用Skill 4. **[Efficient Vision-Language-Action Models](https://arxiv.org/abs/2510.17111)** — VLA高效优化（低延迟+内存优化），适合本地部署 5. **[Vlaser: Synergistic Embodied Reasoning](https://arxiv.org/abs/2510.11027)** — 具身推理VLA，未来"照片→动作决策"的理论基础 ## 核心能力将 DiePre（模切压痕）机器视觉感知与 SOUL 认知框架融合： 1. **视觉已知/未知分离**：从图像中提取确定特征（已知）与模糊区域（未知） 2. **文件记忆**：每次检测结果写入 `vision_log/YYYY-MM-DD.jsonl` 3. **四向视觉碰撞**：正视角、反转、侧光、整体布局四个维度同时分析 4. **人机闭环质检**：AI 初判 → 人类复核 → 标注反馈 → 模型持续进化 5. **置信度质检输出**：低于 90% 置信度的缺陷自动升级为人工复核 ## 安装命令 ```bash clawhub install diepre-vision-cognition # 或手动安装 cp -r skills/diepre-vision-cognition ~/.openclaw/skills/ ``` ## 调用方式 ```python from skills.diepre_vision_cognition import DiePrevisionCognition vision = DiePrevisionCognition(workspace=".") result = vision.analyze( image_path="path/to/dieline.png", context={"material": "corrugated", "thickness_mm": 3.0} ) print(result.confidence) # 置信度 print(result.defects) # 检测到的缺陷列表 print(result.collision_log) # 四向分析详情 ```

diepre-vision-cognition

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载 Zip 包

diepre-vision-cognition