一个DP后的性质和概念有什么效果?(上)

本文章介绍一个比较新的开源项目差分隐私拉普拉斯机制代码,针对机器学习者,程序员,相关领域学习者。

明天在微软搜索差分隐私的性质时,发觉了一本新书《ProgrammingDifferentialPrivacy》[1],可以直接在线阅读,而且附送编程实践。大约浏览了一下,内容写的很朴素并且很直接,但是对一些差分隐私的概念居然都有代码,来直观地告诉你这种性质和概念是有哪些疗效。

网页链接如下:

例如,差分隐私有一个性质是”SequentialComposition”,讲的是把两个DP后的函数组合上去满足哪些样的DP(DP即差分隐私简写,下文同)。文中寥寥几句就讲了清楚:

图片[1]-一个DP后的性质和概念有什么效果?(上)-唐朝资源网

光是讲了一下还不够,作者还写了点代码演示。下边这段代码是用了拉普拉斯分布来说明这个性质。

我先做一些代码解释:F1和F2可以看作两个不同的满足差分隐私的函数,分别满足epsilon1和epsilon2。F3是一个直接满足epsilon_total-DP的拉普拉斯分布,而Fcombined是一个将F1和F2直接加上去求平均的函数。因为SequentialComposition的性质,F_combined也是满足epsilon_total-DP的(由于epsilon1+epsilon2=epsilon_total)。

epsilon1 = 1
epsilon2 = 1
epsilon_total = 2
# satisfies 1-differential privacy
def F1():
    return np.random.laplace(loc=0, scale=1/epsilon1)
# satisfies 1-differential privacy
def F2():
    return np.random.laplace(loc=0, scale=1/epsilon2)
# satisfies 2-differential privacy
def F3():
    return np.random.laplace(loc=0, scale=1/epsilon_total)
# satisfies 2-differential privacy, by sequential composition
def F_combined():
    return (F1() + F2()) / 2

之后我们直接看F3和F_combined这两个都满足同样epsilon_total-DP的分布,画下来是哪些样的。如右图所示,两个满足同样DP的分布,F_3却比F_combined更尖锐一点,也即F_3的残差更小,更稳定。直观来说,这就说明F_3更好。

图片[2]-一个DP后的性质和概念有什么效果?(上)-唐朝资源网

为何?这其实是应当的!由于F_combined只是我们用SequentialComposition得到的一个满足epsilon_total的的下界。为此差分隐私拉普拉斯机制代码,看起来性能更差如我们所料。

好了,这本书的介绍就到这儿。这篇文章也当作是一个书签,上次自己见到的时侯也便捷点开浏览。

参考文献

ProgrammingDifferentialPrivacy,Near,JosephP.andAbuah,Chiké,2021

© 版权声明
THE END
喜欢就支持一下吧
点赞105 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片