随机平滑是一种流行的ML防御方法,用于训练可证明稳健的模型,并验证模型对特定输入数据点的鲁棒性。其核心原理是通过采样高斯噪声来探索数据点周围的区域,从而证明模型在对抗样本攻击下的稳健性。本文展示了一种全新的攻击,攻击者利用随机平滑机制中的随机性进行后门攻击,仅需进行极小的更改即可实现攻击且难以被检测。通过在随机数生成器中植入隐藏攻击,传统的 NIST 随机性测试无法检测到这种异常。