英文题目:《SNIS: A Signal Noise Separation-Based Network for Post-Processed Image Forgery Detection》

中文题目:《SNIS:一种基于信号噪声分离的后处理图像伪造检测网络》

论文作者:Jiaxin Chen; Xin Liao; Wei Wang; Zhenxing Qian; Zheng Qin; Yaonan Wang

发布于:TCSVT

发布时间:2022-09-06

级别:中科院二区

论文链接:10.1109/TCSVT.2022.3204753

论文代码:暂无

摘要

图像伪造检测由于其潜在的安全威胁,引起了学术界和工业界的广泛研究兴趣。现有的伪造检测方法在伪造图像未经过后处理的情况下,可以通过观察图像统计特征的变化来检测篡改区域,具有优异的篡改区域定位性能。然而,在特定场景下,伪造图像可能会被仔细地后处理以隐藏伪造边界。这对这些方法提出了严峻的挑战。本文将图像伪造检测与盲信号分离进行类比分析,将处理后的图像伪造检测问题转化为信号噪声分离问题。 我们还提出了一种基于信号噪声分离( SNIS )网络来解决后处理图像伪造的检测问题。具体来说,我们首先采用信号噪声分离模块,将篡改区域从含有后处理噪声的复杂背景区域中分离出来,削弱甚至消除了后处理对伪造检测的负面影响。然后,多尺度特征学习模块采用并行空洞卷积架构,从多个角度学习高层全局特征。此外,利用特征融合模块,通过加强边界信息来增强篡改区域和真实区域的可区分性。 最后,设计预测模块对篡改区域进行预测,并对篡改操作类型进行分类。大量实验表明,本文提出的SNIS不仅可以有效地对未经后处理的伪造图像进行伪造检测,而且对多种后处理攻击具有较好的鲁棒性。此外,SNIS在检测来自未知来源的伪造图像方面具有鲁棒性。

本文聚焦的问题

现实中的造假图片在造假后通常会再进行模糊、压缩等后处理来把造假的边界痕迹洗掉,导致现有模型在这种“造假+掩饰”的场景下检测效果急剧下降。因此这篇论文研究的核心就是:在伪造已经被刻意掩盖、干扰、扰乱之后,怎么还能把真正的伪造信号和后处理噪声分开,从而依然能准确定位被篡改的区域,并识别篡改类型。

本文提出的方法

本文的核心方法是把后处理带来的干扰噪声先从图像中独立分离出来,让模型先“净化输入”,再做伪造判断。具体流程是:输入图像先经过信号/噪声分离模块把 tampered signal 和 background noise 拆开;拆干净后再做多尺度特征学习 → 特征融合提升边界辨识能力 → 最终输出篡改区域定位与篡改操作分类。

image-20251107205722885

噪声分离

噪声分离的原理本质就是:把当前这张被造假+后处理过的图,当成是两个不同信号混合在一起 —— 一个是真正篡改区域产生的“前景伪造信号”,一个是后处理操作带来的“背景噪声信号”。然后利用盲信号分离(BSS)的方法,把这个混合信号重新反推回两个独立源信号。

伪造定位&篡改方法识别

  • 伪造定位:通过先把伪造信号和后处理噪声分开,再用“差异图”去放大篡改边界的细微异常,然后让网络专门学这种局部不一致特征,最后由 RPN + mask 头输出像素级区域位置。

因为真正的伪造部分在信号分离后,它的前景成分和背景成分的差异会特别大 而正常真实未篡改区域两者差异会很小。

  • 篡改方法识别:同时网络会从原图做多尺度语义特征分析,不同篡改方式本身在全局语义上呈现不同模式(像拼接语义不连贯 / 拷贝移动会出现自相似 / 删除有不自然填补),这些特征在融合后送到分类头去判别。

阅读总结

不足

当没有后处理噪声可分时,SNIS 的分离优势不显著,定位反而不如无需分离的强基线(RGB-N/Cons-N),这限定了它的适用场景

改进措施

让“分离”不是整张图统一做,而是变成“只在需要的地方做、强度根据局部自动调节”。