CONTRASTIVE-ECOC: LEARNING OUTPUT CODES FOR ADVERSARIAL DEFENSE

英文题目：《CONTRASTIVE ECOC: LEARNING OUTPUT CODES FOR ADVERSARIAL DEFENSE》

中文题目：《ECOC：学习输出代码以进行抗辩》

发布于：arxiv

级别：

论文链接：

摘要

虽然独热编码通常用于多类分类，但它并不总是最有效的编码机制。纠错输出码（ECOC）通过将每个类映射到用作标签的唯一码字来解决多类分类问题。传统的ECOC方法依赖于手动设计或随机生成的码本，这是劳动密集型的，并且可能会产生次优的、与数据集无关的结果。本文介绍了三种基于对比学习的自动码本学习模型，允许码本直接自适应地从数据中学习。在四个数据集上，与两个基线相比，我们提出的模型对对抗性攻击表现出上级鲁棒性。

本文聚焦的问题

传统ECOC方法依赖人工设计或随机生成的码本，这不仅耗时费力，而且生成的码本可能与数据集特性不匹配，导致性能次优；现有对抗防御机制（如对抗训练）与ECOC方法并非互斥，但如何自动学习适合特定数据集的码本，并兼顾类别间区分性（行分离）与编码维度独立性（列分离），仍是一个未充分解决的问题；传统one-hot编码将类别视为正交，忽略了类别间关系，缺乏灵活性，在对抗攻击下鲁棒性较差。

本文提出的方法

本文针对上述问题，提出了三种基于对比学习（Contrastive Learning）的自动化码本学习（Automated Codebook Learning, ACL）方法，分别称为：

ACL-PF（ACL by Pretraining & Finetuning）
核心思想：通过两阶段策略（预训练+微调）实现码本的自动学习。
具体步骤：
预训练阶段：利用SimCLR框架进行表示学习，同时引入ECOC编码器将类别映射为码字，并通过列分离损失（Column Separation Loss, Lcsl）降低不同分类器输出间的相关性。
微调阶段：固定预训练得到的特征提取器与ECOC编码器，利用标注数据生成码本，并通过行分离损失（Row Separation Loss, Lrsl）最大化不同类别码字间的距离，同时结合交叉熵损失（Lce）与Hinge损失（Lhl）优化模型。
特点：码本在预训练结束后一次性生成，微调阶段不再更新。
ACL-CFPC（Co-Fine-tuning Model and Codebook with Pretrained Codebook）
核心思想：在ACL-PF基础上，动态调整码本以更好地适应数据分布。
具体步骤：
在微调阶段，每批次动态更新码本，而非使用固定码本。
引入最大余弦相似度最小化损失（Maximum Cosine Similarity Minimization Loss, Lmcsm），进一步增强类别间码字的区分度。
特点：码本与模型参数联合优化，适应性强，鲁棒性进一步提升。
ACL-TFC（Training with Finetuned Codebook）
核心思想：利用ACL-CFPC预训练得到的固定码本，从头训练模型参数。
具体步骤：
先用ACL-CFPC训练得到最优码本，然后固定该码本，重新初始化模型参数（随机权重），从头开始训练模型。
特点：通过固定结构化码本，引导模型学习更鲁棒的特征表示，尤其适用于对抗攻击场景。

阅读总结

1、自动化与数据自适应性
摆脱人工设计：传统 ECOC 需要人工或随机生成码本，费时费力且难以针对特定数据集优化；ACL 系列方法首次端到端地从数据中自动学习码本，无需人工干预。
数据集专属码本：通过对比学习引导，码本结构能够自适应地贴合具体数据集的类别分布与特征空间，避免“一刀切”的通用码本带来的性能损失。

2、鲁棒性显著提升
对抗攻击表现突出：在 FGSM、PGD 等白盒攻击下，ACL 方法相较 Standard 和 SimCLR 基线，鲁棒准确率大幅提高。例如：
CIFAR-10：PGD 攻击下 Standard 直接降为 0%，ACL-CFPC 仍保持 3.21%，ACL-TFC 高达 14.51%。
Fashion-MNIST：PGD 攻击下 ACL-TFC 达到 35.09%，远超基线的 3.77%。
错误容忍度增强：通过最大化码字间距离（行分离）与最小化分类器相关性（列分离），即使部分 bit 被攻击扰动，整体仍能正确纠错。

3、灵活的三级策略
ACL-PF：预训练后固定码本，实现简单、训练稳定，适合资源受限场景。
ACL-CFPC：微调阶段动态更新码本，实时对齐模型状态，鲁棒性与干净准确率兼顾。
ACL-TFC：利用固定“最优码本”从头训练，在强攻击场景下鲁棒性最强，为安全关键应用提供了高保障方案。