首页新闻手机家电数码电脑财经大模型直播

360AI安全风险白皮书：小心深度学习逃逸攻击

来源：科技在线 2018-02-13/16:08

正文

2017以来，人工智能的兴起让“深度学习”这个词频繁出现在公众视野。有了深度学习算法，机器也能够模拟人类的思考方式，自主获取知识，修习技能，完成很多常人无法完成的任务。但是作为一种新兴技术，深度学习算法自身仍存在很多安全缺陷和漏洞。近日360安全研究院发布的《AI安全风险白皮书》结合深度学习逃逸攻击方面的实例和研究工作，详细解读了人工智能应用所面临的安全风险。

“逃逸攻击”是一个专业术语，它指的是攻击者在不改变目标机器学习系统的情况下，通过构造特定输入样本以完成欺骗目标系统的攻击。例如，攻击者可以修改一个恶意软件样本的非关键特征，使得它被一个反病毒系统判定为良性样本，从而绕过检测。

图1：攻击者生成对抗样本使系统与人类有不同的判断

以最近颇受关注的图像识别为例，图像识别的原理是具备深度学习能力的人工智能系统，模仿人类视觉功能，通过一定的算法规则，区分不同的图像目标。但是，目前图像识别深度学习所依赖的判断规则和人眼的视觉机理仍存在较大的差距，这也就意味着：只要对目标图片稍加改造，图像识别系统就有可能在完全正常的流程下输出一个截然不同的错误结果。

此前，Ian Goodfellow在2015年ICLR会议上就提出了著名逃逸样本，样本使用了谷歌的深度学习研究系统，该系统利用卷积神经元网络，能够精确区分熊猫和长臂猿等图片。不过，攻击者对熊猫的图片“稍加改造”，增添了一些干扰因素。虽然这细微的差别并不会影响人类的判断，不过图像识别深度学习系统却会把熊猫误认为长臂猿。