英文题目:《Let Images Speak More: An Efficient Method for Detecting Image Manipulation History》

中文题目:《让图像更能“开口说话”:高效检测图像篡改历史的方法》

论文作者:Yang Wei; Haowei Liu; Xiaochen Yuan; Xiuli Bi; Bin Xiao

发布于:TCSVT

发布时间:2025-05-20

级别:CCF-B

论文链接:10.1109/TCSVT.2025.3571767

论文代码:https://github.com/CherishL-J/Op-detection

摘要

数字图像取证旨在验证数字图像的真实性,已成为一 个重要的研究领域。为了揭示图像的篡改历史,现有方法只能检测特定的图像操作,或者基于高维度的通用取证特征。此外,这些方法只有在操作链长度不超过2时表现良好。然而,对于操作链更长、更能代表现实场景的图像,它们的检测精度会显著下降。 为了打破这些局限性,我们提出了一种基于直方图和细节图的取证频率特征(FHDM(79D)),它可以区分包含不同数量操作的各种操作链。具体来说,与图像篡改在空间域留下的痕迹相比, 我们发现它们在频域中更加明显。这一观察促使我们从图像的频域中提取特征,通过分析它们的直方图和细节图来捕捉图像的篡改痕迹。值得注意的是,我们在频域中提取的特征比常用的通用取证特征(如SRM(714D))的维度减少了近90%,大大降低了计算复杂度。同时,与基于深度学习的方法相比,实验表明,我们提出的方法在多个数据集上对图像操作的检测精度超过95%, 而其他基于深度学习的方法不超过90%。大量的实验结果表明, 我们提出的方法更具通用性和有效性,在复杂操作链检测和局部 伪造检测中表现出良好性能。代码可在https://github.com/CherishL-J/Op-detection获取。

本文聚焦的问题

概念解释

图像操作链(图像操作历史):指的是图像在创建、传输或编辑过程中经历的多重处理操作或编辑步骤形成的序列。在进行这些操作过程中都在图像上留下特定痕迹。

检测图像操作链:是指识别和重建这些操作的顺序和类型,揭示图像的处理历史,以确保其真实性和完整性。

核心问题

当图像经历多次连续操作后,这些不同操作之间并非简单相加,而是可能相互干扰、抵消或放大彼此的痕迹,使其越来越难以准确揭示其完整的操作历史。

为了解决该问题,论文提出一个新的取证框架,该框架系统地分离交织的伪造痕迹能够准确重建图像的完整操作历史,即使涉及多次连续操作也是如此

论文核心贡献

  • 发现图像的直方图或细节图的频率分布对不同操作更具区分性。因此,提出一种基于直方图和细节图的频率伪造特征(FHDM(79D)),它克服了当前检测方法的局限性,即只能检测短操作链。
  • FHDM的维度比常用的通用伪造特征(如 SRM(714D))几乎少90%大大降低了计算复杂度, 同时确保了检测精度。此外,其强大的泛化能力使其在各种操作链和局部伪造检测中表现良好。
  • 大量实验表明,所提出的方法在检测不同长度的操作 链时达到了最高的精度。它还在具有挑战性的场景中表现良好,例如检测长操作链和处理涉及传统和深度学习方法的操作。

本文提出的方法

image-20251102111039784

本文建立了一个频域伪造检测框架,用于揭示图像的完整篡改链。整个流程从输入图像开始,首先计算其灰度直方图细节图(detail map),以同时保留全局亮度分布与局部纹理残差特征。随后对二者分别进行一维离散傅里叶变换(1-D DFT),得到对应的频谱幅度分布。作者发现,不同图像操作在频域中的响应差异更显著,因此从这些频率分布中提取统计特征,构成仅 79 维的频率伪造特征(FHDM(79D))。该低维特征既能刻画全局又能反映方向性信息(水平、垂直细节频谱),再输入至分类器,便可区分图像经历的不同操作或操作组合,从而实现对**多步篡改链(m≥2, n≥2)**的检测与识别。实验表明,该框架在保持高检测精度的同时显著降低了计算复杂度,对复杂、多重操作链仍具良好鲁棒性。

阅读总结

不足

频域特征的局限性:该方法强调频域特征对于识别图像操作链的重要性,但频域特征并不是所有操作都能有效区分的。例如,色调调整、亮度修改等操作可能不会在频域中留下明显的特征。这意味着该方法可能在处理细微操作或色彩调整类篡改时表现较差。

改进措施

可以结合空间域和频域特征。空间域的特征(例如局部块的变化、边缘检测等)可能能更好地捕捉到某些操作的细节,尤其是在涉及色彩或对比度调整时。