Privacy Definitions - (alpha, beta)-privacy

如果對一個事件AA越確定,該事件的概率P(A)P(A)就越大;對一個事件BB越不確定,則該事件的概率P(B)P(B)就越小。通過事件AA,可以增大事件BB的確定性,也可能造成干擾降低對事件BB的確定性。
在隱私中,爲了可能地保護隱私,應儘可能讓攻擊者在發佈統計數據後對某個事件的確定性,和發佈前對該事件的確定性相差不大。發佈統計數據後對某個事件的確定性稱爲後驗知識,發佈前對該事件的確定性稱爲先驗知識。如發佈前事件A的概率爲P(A)=0.3P(A)=0.3,發佈統計數據R(A)R(A)後,攻擊者對事件A的概率確定性提高到了P(AR(A))=0.9P(A|R(A))=0.9,那麼在某種程度上泄漏了事件AA的隱私,不能夠很好地保護隱私。

隱私上缺口(upward (alpha, beta)-privacy breach)

定義(upward (α,β)privacy breachupward\ (\alpha,\beta)-privacy\ breach)1定義RR是輸入爲uDUu\in D_{U},輸出爲vDVv\in D_{V}的算法。如果對於某個概率分佈ff,存在一個預測器ϕ\phi,有:
uDu,vDv,s.t. Pf(ϕ(u))α and Pf(ϕ(u)R(u)=v)β,\exists u\in D_u,\exists v\in D_v, s.t.\ P_{f}(\phi(u))\leq \alpha\ and\ P_{f}(\phi(u)|R(u)=v)\geq \beta,
則稱算法RR存在(α,β\alpha,\beta)隱私上缺口(upward (alpha, beta)-privacy breach)。

MARK

  1. 算法RR可以簡單理解爲一個函數,定義域爲DUD_U,值域爲DVD_V
  2. 算法RR可以認爲是對數據(比如疾病)進行了處理後發佈,一種常用的方式是加噪處理。
  3. 例:若α=0.3,β=0.9\alpha=0.3,\beta=0.9,若算法RR存在隱私上缺口,那麼攻擊者通過發佈的信息得到了額外的知識,對uu能夠更加準確的預測。

隱私下缺口(downward (alpha, beta)-privacy breach)

同樣地可以定義隱私下缺口:
定義(downward (α,β)privacy breachdownward\ (\alpha,\beta)-privacy\ breach):定義RR是輸入爲uDUu\in D_{U},輸出爲vDVv\in D_{V}的算法。如果對於某個概率分佈ff,存在一個預測器ϕ\phi,有:
uDu,vDv,s.t. Pf(ϕ(u))β and Pf(ϕ(u)R(u)=v)α,\exists u\in D_u,\exists v\in D_v, s.t.\ P_{f}(\phi(u))\leq \beta\ and\ P_{f}(\phi(u)|R(u)=v)\geq \alpha,
則稱算法RR存在(α,β\alpha,\beta)隱私上缺口(upward (alpha, beta)-privacy breach)。

MARK

  1. 注意α,β\alpha,\beta互換位置了;
  2. 例:若α=0.05,β=0.6\alpha=0.05,\beta=0.6,若算法RR存在隱私上缺口,那麼攻擊者通過發佈的信息可以非常確定uu是不太可能出現的。

(alpha, beta)-privacy

定義:((α,β)privacy(\alpha,\beta)-privacy).定義RR是輸入爲uDUu\in D_{U},輸出爲vDVv\in D_{V}的一個算法。當RR不存在(α,β\alpha,\beta)隱私上缺口和(α,β\alpha,\beta)隱私下缺口時,稱RR滿足(α,β)privacy(\alpha, \beta)-privacy

MARK

  1. 該定義從算法的角度,而不是數據的角度定義了隱私;
  2. 該定義限制了攻擊者在看到發佈數據後,對任意事件確定性的變化,即概率差不超過βα\beta-\alpha

  1. https://www.researchgate.net/publication/220626610_Privacy-Preserving_Data_Publishing ↩︎

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章