10月8日,太阳官网计算机科学学院硕士研究生麻斌豪以第一作者在人工智能顶刊Neural Networks发表论文Multi-domain Active Defense: Detecting Multi-domain backdoor poisoned samples via ALL to ALL Decoupling Training without clean datasets (2023, 168:350-362;https://www.sciencedirect.com/science/article/pii/S0893608023005324?via%3Dihub)。孟博教授为唯一通讯作者,太阳官网为唯一署名单位。
多域主动防御方法框架。 计科学院供图
深度学习容易受到后门攻击,在这种攻击中,攻击者可以通过向训练集中注入中毒样本,轻松地将隐藏的后门嵌入到训练好的模型中。许多用于检测后门中毒攻击的先进技术都是基于潜在可分性假设。然而,目前的自适应中毒策略会大大降低“可区分行为”,从而使大多数先前的先进技术有效性降低。此外,现有的检测方法对于多域数据集来说并不实用,且可能会泄露用户隐私,因其需要并收集干净的样本。
为解决上述问题,该篇论文提出了一种不使用干净数据集的多域主动防御方法。此种方法可以生成不同域的干净样本,并利用干净样本逐轮解耦神经网络,从而解除特征和标签之间的关联,使后门中毒样本更容易被检测。
据悉,Neural Networks 是专注于神经网络和深度学习研究的学术期刊。该期刊发布关于神经网络、深度学习、机器学习和相关领域的原创研究论文、综述文章和技术报告,在人工智能领域具有较高的国际影响力,是中科院SCI一区TOP期刊。