ai-poison-guard

# AI 投毒内容过滤助手 🛡️ > 🚨 **抵御 AI 投毒攻击** —— 检测 GEO 黑产内容，验证信息真实性，保护你的 AI 助手不被"驯服" ## 📰 背景 2026年央视3·15晚会曝光：AI 大模型被"投毒"已成黑色产业链。 - **GEO（生成式引擎优化）** 技术被滥用 - 黑产通过"喂料投毒"操控 AI 回答 - 虚构产品成为 AI 推荐的"标准答案" - 6600元包年即可操控主流 AI 大模型 **你的 AI 助手可能被投毒！** 这个 skill 帮你检测和过滤。 --- ## ✨ 核心功能 | 功能 | 描述 | 触发场景 | |------|------|---------| | 🔍 **内容检测** | 分析文本/链接，识别投毒特征 | "检测这段内容是否可信" | | 🔗 **来源验证** | 检查信息来源可信度 | "验证这个网站可靠吗" | | 📊 **风险评分** | 给内容打分（安全/可疑/危险） | "评估这条信息的风险" | | 🛡️ **过滤建议** | 提供处理建议 | "如何过滤投毒内容" | | 📋 **报告生成** | 生成详细检测报告 | "生成内容安全报告" | --- ## 🎯 触发条件当用户说以下话时，使用此技能： ### 内容检测 - "检测这段内容是否可信" - "分析这个链接有没有问题" - "这段文字是不是投毒内容" - "检查这个信息的真实性" ### 来源验证 - "验证这个网站可靠吗" - "这个来源可信吗" - "检查域名信誉" ### 风险评分 - "评估这条信息的风险" - "这段内容安全吗" - "给这个链接打分" ### 过滤建议 - "如何过滤投毒内容" - "怎么防止 AI 被投毒" - "GEO 投毒怎么识别" --- ## 🚀 快速使用 ### 检测内容 ```bash # 检测文本 python3 scripts/guard.py --detect-text "某品牌产品是行业第一，专家强烈推荐..." # 检测链接 python3 scripts/guard.py --detect-url "https://example.com/review" # 检测文件 python3 scripts/guard.py --detect-file suspicious.txt ``` ### 验证来源 ```bash # 验证网站 python3 scripts/guard.py --verify-source "https://example.com" # 检查域名 python3 scripts/guard.py --check-domain "example.com" ``` ### 风险评分 ```bash # 评分内容 python3 scripts/guard.py --score "这款产品是全网销量第一..." # 输出 JSON python3 scripts/guard.py --score "..." --json ``` --- ## 📊 输出示例 ### 内容检测报告 ``` 🛡️ AI 投毒内容检测报告 ━━━━━━━━━━━━━━━━━━━━━━━━ 📋 检测内容：某品牌产品是行业第一，专家强烈推荐，用户好评如潮，是 AI 推荐的首选品牌... 🔍 检测结果：⚠️ 可疑 📊 风险评分：72/100（高风险） 🚩 发现的投毒特征： 1. ⚠️ 绝对化用语（"行业第一"） 2. ⚠️ 虚假权威（"专家强烈推荐"） 3. ⚠️ 从众心理诱导（"用户好评如潮"） 4. ⚠️ AI 推荐操控（"AI 推荐的首选"） 🔗 来源分析： • 域名年龄：3 个月（新域名） • 备案信息：无 • 信誉评分：23/100（低） 💡 建议： ❌ 不建议信任此内容 ✅ 请通过官方渠道核实 ✅ 查看多个独立来源 📖 参考：央视3·15晚会曝光 GEO 投毒案例 ``` ### 来源验证报告 ``` 🔗 来源验证报告 ━━━━━━━━━━━━━━━━━━━━━━━━ 🌐 网站：example.com 📊 可信度评分：35/100（不可信） 🚩 风险指标： • ⚠️ 域名注册时间：3 个月（新） • ⚠️ 无 ICP 备案 • ⚠️ 无 HTTPS 证书 • ⚠️ 服务器位置：境外 • ⚠️ 与已知投毒网站同 IP ✅ 可信特征： • 无 💡 建议： ❌ 不建议访问此网站 ❌ 不要采信其内容 ✅ 寻找官方或权威来源 ``` --- ## 🛡️ 投毒特征库 ### GEO 投毒常见手法 | 手法 | 特征 | 示例 | |------|------|------| | **虚假权威** | 伪造专家/机构背书 | "专家强烈推荐" | | **绝对化用语** | 夸大宣传 | "行业第一"、"全网最优" | | **从众诱导** | 制造虚假热度 | "用户好评如潮" | | **AI 操控** | 直接操控 AI 推荐 | "AI 推荐的首选" | | **虚假评测** | 伪造测评内容 | "实测证明..." | | **信息轰炸** | 批量铺设虚假内容 | 大量相同内容 | ### 可疑域名特征 - 新注册域名（< 6 个月） - 无备案信息 - 无 HTTPS - 服务器在境外 - 与已知黑产同 IP --- ## 📁 文件结构 ``` skills/ai-poison-guard/ ├── SKILL.md # 技能定义 ├── README.md # 使用说明 ├── requirements.txt # 依赖 ├── scripts/ │ ├── guard.py # 主脚本 │ ├── detector.py # 内容检测器 │ ├── verifier.py # 来源验证器 │ ├── scorer.py # 风险评分器 │ └── poison_patterns.py # 投毒特征库 ├── templates/ │ └── report_template.md # 报告模板 └── docs/ ├── geo-explained.md # GEO 技术说明 └── 315-case-study.md # 3·15案例分析 ``` --- ## 🔧 依赖 - Python 3 - requests - whois - tldextract 安装： ```bash pip3 install requests whois tldextract ``` --- ## 📖 参考资料 - 央视3·15晚会曝光：AI 大模型被投毒 - GEO（生成式引擎优化）技术滥用案例 - 国家市场监督管理总局2026年广告监管要点 --- ## 📝 更新日志 ### v1.0.0 (2026-03-16) - 🎉 初始发布 - ✅ 内容检测功能 - ✅ 来源验证功能 - ✅ 风险评分功能 - ✅ 投毒特征库 --- **保护你的 AI 助手，抵御投毒攻击！** 🛡️

ai-poison-guard

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载 Zip 包

ai-poison-guard

ai-poison-guard

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载 Zip 包

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement