指标	说明	检测方法	置信权重
ELA误差分析	被篡改区域重压缩等级不同	ErrorLevelAnalysis工具	高
PDF结构法证

指标	说明	检测方法	置信权重
流量模式异常	突发性访问量/低质量页面高流量	流量分析工具	高
用户代理异常

局限性	影响	缓解方法
非母语写作者假阳性	文本检测准确率显著下降	额外人工判断
对抗性规避

AI内容检测完整指南

概述

本技能提供对AI生成内容（文本、图片、视频、音频、文档、链接）的系统性检测方法，包含技术证据指标、置信度框架、工具对比及当前AI内容占比统计数据（截至2025年3月）。

检测目标	直接跳转
文章/文本是否AI生成	→ 第2.1节（文本检测）
图片是否AI生成/伪造

统计项	数值	来源
新发布网页含AI内容比例	74.2%	Ahrefs 2025年4月研究（90万页样本）
所有在线文章中AI撰写比例

指标	说明	AI特征	置信权重
困惑度（Perplexity）	衡量文本的语言不可预测性	AI文本困惑度低（5-10），人类文本高（20-50）	高（但受语言水平影响）
突发性（Burstiness）

强证据（单项即可怀疑）：
✓ 检测到合法水印信号（如C2PA标准）
✓ N-gram分析匹配已知LLM输出分布
✓ 困惑度持续低于10分（标准英文基准）

中等证据（需多项组合）：
✓ 全文突发性标准差<0.3（异常均匀）
✓ 句子长度标准差<5词（机械规律）
✓ 无拼写错误、无口语化错误
✓ 标点使用完全符合规范（人类有自然偏差）

辅助证据（仅作参考）：
✓ 逻辑结构过于完整（引言-正文-结论）
✓ 缺乏个人经历、情感波动、偏见
✓ 回避争议性立场

指标	说明	检测方法	置信权重
视觉伪影（Visual Artifacts）	像素排列异常、边缘失真	像素级检查、局部放大	高
GAN棋盘格纹

强证据：
✓ FFT/DCT分析发现低频域周期性异常
✓ ELA显示局部区域再压缩痕迹
✓ 皮肤/毛发边缘高度局部放大后出现混合伪影
✓ 检测到C2PA/Content Credentials内容凭据

中等证据：
✓ EXIF元数据完全缺失（现代相机必有）
✓ 手指数量≠5或手指形状异常
✓ 背景中文字无法辨认或逻辑混乱
✓ 眼睛/牙齿区域不自然的对称性

辅助证据：
✓ 整体风格过于完美（无噪点、无自然缺陷）
✓ 珠宝、眼镜等配件细节异常

指标	说明	检测方法	置信权重
面部特征漂移（FFD）	连续帧之间面部特征微妙漂移抖动	帧间比较	高
时域频率伪影

强证据：
✓ 0.25x慢速播放可见形变/翘曲效应
✓ 面部特征漂移（眼/鼻/嘴在静态场景中微抖）
✓ 唇形与音频明显不同步
✓ 帧间光流分析发现非物理运动轨迹

中等证据：
✓ 牙齿细节在不同帧间变化
✓ 头发/耳朵边缘区域出现融合伪影
✓ 视频元数据缺失相机型号信息
✓ 长视频（64帧+）时间轴上累积不一致性

辅助证据：
✓ 背景元素在镜头切换间不自然变化
✓ 环境光源方向与面部高光矛盾

指标	说明	检测方法	置信权重
梅尔频谱（Mel Spectrogram）	时频模式保留分析	CNN分类器 + Grad-CAM	高
MFCC系数