团体标准网
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211125687.2 (22)申请日 2022.09.16 (65)同一申请的已公布的文献号 申请公布号 CN 115238827 A (43)申请公布日 2022.10.25 (73)专利权人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 赵闻飙 申书恒 张长浩 傅欣艺  王维强  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 陈霁 周良玉 (51)Int.Cl. G06K 9/62(2022.01) G06F 21/62(2013.01) (56)对比文件 CN 111177768 A,2020.0 5.19CN 111046422 A,2020.04.21 WO 2021114931 A1,2021.0 6.17 CN 113553624 A,2021.10.26 CN 114513337 A,202 2.05.17 CN 110991620 A,2020.04.10 CN 114780999 A,2022.07.22 WO 2021218 828 A1,2021.1 1.04 CN 114282684 A,202 2.04.05 US 11308359 B1,202 2.04.19 CN 113807275 A,2021.12.17 CN 111177791 A,2020.0 5.19 CN 111523668 A,2020.08.1 1 CN 113268991 A,2021.08.17 CN 112487479 A,2021.0 3.12 芈小龙等.面向深度学习的差分隐私保护方 法. 《舰船电子 工程》 .2020,(第09期), (续) 审查员 曹宁 (54)发明名称 保护隐私的样本 检测系统训练方法及装置 (57)摘要 本说明书实施例提供一种保护隐私的样本 检测系统训练方法及装置, 样 本检测系统包括表 征模型、 生成器和分类模 型。 该方法包括: 利用将 k个采样噪声分别输入生成器而得到的k个模拟 表征, 对表征模 型输出的隐私样 本表征进行表征 混淆处理, 得到混淆表征; 利用白样本标签对隐 私样本标签进行标签混淆处理, 得到混淆标签; 基于混淆表征和分类模型, 得到分类预测结果; 将k个模拟表征分别输入判别器, 得到k个第一判 别结果; 以减小分类预测结果和混淆标签之间的 差异, 以及增大k个第一判别结果指示对应表征 为真实表征的概率为目标, 训练异常检测系统; 基于判别器针对表征模型输出的公开白样本表 征的第二判别结果和上述k个第一判别结果, 训 练判别器 。 [转续页] 权利要求书3页 说明书10页 附图3页 CN 115238827 B 2022.11.25 CN 115238827 B (56)对比文件 张海军等.类图像处 理面向大 数据XSS入侵 智能检测研究. 《计算机 应用与软件》 .2020,(第 02期),Deyan Tang等.Gender-Adversarial Networks for Face Privacy Preservi ng. 《IEEE Internet of Thi ngs Journal 》 .202 2, 第17568 - 17576页.2/2 页 2[接上页] CN 115238827 B1.一种保护隐私的样本检测系统训练方法, 所述样本检测系统包括表征模型、 生成器 和分类模型, 所述方法包括: 将隐私样本集中的第一样本输入所述表征模型, 得到第一表征, 所述 隐私样本集中包 括多个隐私白样本和多个隐私黑样本; 将k个采样噪声分别输入所述 生成器, 得到k个模拟表征; 利用所述k个模拟表征对所述第一表征进行表征混淆处理, 得到混淆表征, 并且, 利用 白样本标签对所述第一样本的样本标签进行 标签混淆处 理, 得到混淆 标签; 基于所述混淆表征和所述分类模型, 得到分类预测结果, 并且, 将所述k个模拟表征分 别输入判别器, 得到k个第一判别结果; 以减小所述分类预测结果和混淆标签之间的差异, 以及增大所述k个第一判别结果指 示对应表征为真实表征的概 率为目标, 训练所述样本检测系统; 将公开白样本集中的第二样本输入所述表征模型, 得到第二表征, 从而将所述第二表 征输入所述判别器, 得到第二判别结果; 以减小所述k个第一判别结果指示对应表征为真实表征的概率, 以及增大所述第二判 别结果指示对应表征为真实表征的概 率为目标, 训练所述判别器。 2.根据权利要求1所述的方法, 其中, 在将k个采样噪声分别输入所述生成器, 得到k个 模拟表征之前, 所述方法还 包括: 对高斯分布进行k次随机采样, 得到所述 k个采样噪声。 3.根据权利要求1所述的方法, 其中, 所述表征混淆处 理包括: 从数值区间0 至1中随机 选取k+1个数值, 且该k+1个数值的和值 为1; 利用所述 k+1个数值对所述 k个模拟表征和所述第一表征进行加权求和。 4.根据权利要求3所述的方法, 其中, 所述k+1个数值中用于对所述第一表征进行加权 的数值大于预设阈值。 5.根据权利要求3所述的方法, 其中, 所述标签混淆处 理包括: 利用所述 k+1个数值对k个白样本标签和第一样本的样本标签进行加权求和。 6.根据权利要求1所述的方法, 其中, 基于所述混淆表征和所述分类模型, 得到分类预 测结果, 包括: 随机生成与所述混淆表征 具有相同维数的掩码向量, 其向量元 素为1或‑1; 利用所述掩码向量与所述混淆表征进行对位相乘处 理, 得到掩码表征; 将所述掩码表征输入所述分类模型, 得到所述分类预测结果。 7.根据权利要求1所述的方法, 其中, 以减小所述分类预测结果和混淆标签之间的差 异, 以及增大所述k个第一判别结果指示对应表征为真实表征的概率为目标, 训练所述样本 检测系统, 包括: 根据所述分类预测结果和混淆 标签确定分类损失; 根据所述 k个第一判别结果和模拟类表征 标签, 确定第一判别损失; 基于第一综合损失训练所述样本检测系统, 所述第一综合损失与所述分类损失正相 关, 且与所述第一判别损失负相关。 8.根据权利要求7所述的方法, 其中, 以减小所述k个第一判别结果指示对应表征为真 实表征的概率, 以及增大所述第二判别结果指示对应表征为真实表征 的概率为目标, 训练权 利 要 求 书 1/3 页 2 CN 115238827 B 3

.PDF文档 专利 保护隐私的样本检测系统训练方法及装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 保护隐私的样本检测系统训练方法及装置 第 1 页 专利 保护隐私的样本检测系统训练方法及装置 第 2 页 专利 保护隐私的样本检测系统训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:13:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。