摘要
为有效处理物联网大规模应用所带来的海量数据,深度学习在物联网环境中得到广泛应用。然而,深度模型在训练过程中,存在推理攻击、模型逆向攻击等安全威胁,这会导致输入模型中的原始数据泄露。应用差分隐私对深度模型训练过程的参数进行保护,是解决该问题的有效方式。基于此提出一种物联网环境中基于深度学习的差分隐私预算优化方法,根据参数迭代变化规律,自适应地分配不同预算;为避免噪声过大的问题,引入正则化项对扰动项进行约束,既防止神经网络过拟合,又有助于学习模型的显著特征。实验表明,所提方法可有效增强模型的泛化能力;随着模型迭代次数增加,加噪后训练得到的模型,与使用原始数据训练得到的模型,二者精度差值低于0.5%。因此,所提方法既可实现用户隐私保护,同时有效保证模型可用性,实现了隐私性和可用性的平衡。
关键词: 物联网 ; 差分隐私 ; 正则化 ; 深度学习 ; 隐私预算
0 引言
近年来,物联网技术快速发展,在可穿戴设备、环境监测、物流管理、虚拟现实、智能家居、智能电网、智慧城市和公共服务等诸多场景得到广泛应用,将数字世界和物理世界紧密相连,加速万物互联的时代到来。随着物联网的大规模应用,个人用电信息、健康信息、行动轨迹等涉及个人隐私的海量数据将被物联网终端记录采集。为有效处理物联网应用所带来的海量数据,深度学习被广泛应用在物联网场景下的一些模型训练中,这也带来一些隐私泄露的隐患。在模型训练过程中,模型参数信息可能会遭到推理攻击、模型逆向攻击等安全威胁,进而输入模型中的原始数据可以被反推出来,造成隐私信息泄露。针对上述问题,本文考虑保护模型训练过程的