英文题目:《Is Artificial Intelligence Generated Image Detection a Solved Problem?》

中文题目:《人工智能生成的图像检测问题已经解决了吗?》

论文作者: Ziqiang Li, Jiazhen Yan, Ziwen He,Kai Zeng, Weiwei Jiang, Lizhi Xiong, Zhangjie Fu

发布于:NeurIPS

发布时间:2025-09-19

级别:CCF-A

论文链接:https://doi.org/10.48550/arXiv.2505.12335

论文代码: https://github.com/HorizonTEL/AIGIBench

摘要

生成模型(例如生成对抗网络 (GAN) 和扩散模型)的快速发展使得创建高度逼真的合成图像成为可能,同时也引发了人们对虚假信息、深度伪造和版权侵权的严重担忧。尽管已经提出了许多人工智能生成图像 (AIGI) 检测器,并且通常报告了较高的准确率,但它们在实际场景中的有效性仍然值得怀疑。为了弥合这一差距,我们推出了 AIGIBench,这是一个旨在严格评估最先进 AIGI 检测器的鲁棒性和泛化能力的综合基准测试。AIGIBench 通过四个核心任务模拟真实世界的挑战:多源泛化、对图像退化的鲁棒性、对数据增强的敏感性以及测试时预处理的影响。它包含 23 个不同的伪造图像子集,涵盖了先进和广泛应用的图像生成技术,以及从社交媒体和人工智能艺术平台收集的真实世界样本。对 11 种先进检测器的广泛实验表明,尽管这些检测器在受控环境下表现出较高的准确率,但在真实世界数据上性能显著下降,常用数据增强方法带来的益处有限,且预处理的影响也较为复杂,这凸显了开发更稳健的检测策略的必要性。AIGIBench 提供了一个统一且贴近实际的评估框架,为未来开发可靠且通用的 AIGI 检测方法提供了宝贵的见解。

本文聚焦的问题

该论文旨在回答“人工智能生成图像(AIGI)检测是否已是一个已解决的问题”这一核心质疑。尽管现有检测器在受控实验室环境下常报告超过 95% 的准确率,其在真实场景中的可靠性与泛化能力仍缺乏系统评估。为此,作者提出 AIGIBench——一个覆盖 23 种伪造源、包含社交媒体与 AI 绘画社区真实样本的综合基准——通过四大任务(多源泛化、退化鲁棒性、数据增广敏感性、测试预处理影响)对 11 种前沿检测器进行统一评测。实验揭示:

  • 所有检测器在真实扰动下性能显著下降,F.Acc 常跌至 0% 附近
  • 无单一方法在所有生成场景下持续占优
  • 常规增广与测试裁剪主要提升 R.Acc,对 F.Acc 提升有限甚至为负

综上,论文指出 AIGI 检测远未解决,并提供了可复现、持续演进的评估框架以推动后续研究。

本文提出的方法

构建 AIGIBench 基准

论文首先构建 AIGIBench 作为统一的 evaluation ground,以真实世界语义覆盖为核心目标,涵盖 GAN、扩散、大模型个性化生成、DeepFake 以及社交媒体 / AI 绘画社区 in-the-wild 共 23 个子集,并通过 CLIP 去重、美学过滤、人工伪影剔除等严格数据治理确保样本更接近实际分布与真实难度,从根本上解决现有评估基准数据来源窄、时代滞后、domain 单一的问题,使后续所有检测器评估站在同一个 reality aligned surface 上进行。

设计四维任务体系

  • 多源泛化:在 25 个未见生成器上测试,度量跨模型鲁棒性。
  • 退化鲁棒性:JPEG-50、高斯噪声 σ=4、上下采样三种扰动,模拟真实传输/压缩链路。
  • 数据增广敏感性:Rotation、Color-Jitter、RandomMask 及其组合,量化增广对 R.Acc/F.Acc 的权衡。
  • 测试预处理影响:Crop vs. Resize,验证高频细节保留对真实/伪造检测的不对称作用。

标准化可复现的评估流程

论文对 evaluation 本身进行 protocol 标准化,统一要求所有 detector 使用原论文默认超参不调参,并将评价指标从 overall accuracy 拆解为 R.Acc 与 F.Acc 两个分量,以显式揭露“在真实扰动下 fake collapse / real-safe bias”这种过去被 aggregate accuracy 隐藏的结构性问题,并基于 25 子集平均结果防止 dataset 偏置影响,使结论可以可复现、可比较、可跟踪。

阅读总结

针对当前只覆盖 ProGAN 与 ProGAN+SD-1.4 两种训练设置;未来可加入更多扩散系家族、个性化管线与真实取证影像,做跨域/跨年代分布移位评测,并建立公开排行榜促进可比性与复现性。