解密：阿里巴巴公司根據截圖查到泄露信息的員工的技術是？

原創

2018-09-18 10:08

本文作者 fuqiang liu，文章原載於知乎

一、綜述

本文提供的一種實現“阿里通過肉眼無法識別的標識碼追蹤員工”的技術手段。通過看其他答主的分析，阿里可能還沒用到頻域加水印的技術。

相對於空域方法，頻域加盲水印的方法隱匿性更強，抵抗攻擊能力更強。這類算法解水印困難，你不知道水印加在那個頻段，而且受到攻擊往往會破壞圖像原本內容。本文簡要科普通過頻域手段添加數字盲水印。對於web，可以添加一個背景圖片，來追蹤截圖者。

所謂盲水印，是指人感知不到的水印，包括看不到或聽不見（沒錯，數字盲水印也能夠用於音頻）。其主要應用於音像作品、數字圖書等，目的是，在不破壞原始作品的情況下，實現版權的防護與追蹤。

添加數字盲水印的方法簡單可分爲空域方法和頻域方法，這兩種方法添加了冗餘信息，但在編碼和壓縮情況不變的情況下，不會使原始圖像大小產生變化（原來是10MB添加盲水印之後還是10MB）。

空域是指空間域，我們日常所見的圖像就是空域。空域添加數字水印的方法是在空間域直接對圖像操作（之所以說的這麼繞，是因爲不僅僅原圖是空域，原圖的差分等等也是空域），比如將水印直接疊加在圖像上。

我們常說一個音有多高，這個音高是指頻率；同樣，圖像灰度變化強烈的情況，也可以視爲圖像的頻率。頻域添加數字水印的方法，是指通過某種變換手段（傅里葉變換，離散餘弦變換，小波變換等）將圖像變換到頻域（小波域），在頻域對圖像添加水印，再通過逆變換，將圖像轉換爲空間域。相對於空域手段，頻域手段隱匿性更強，抗攻擊性更高。

所謂對水印的攻擊，是指破壞水印，包括塗抹，剪切，放縮，旋轉，壓縮，加噪，濾波等。數字盲水印不僅僅要敏捷性高（不被人抓到），也要防禦性強（抗打）。就像Dota的敏捷英雄往往是脆皮，數字盲水印的隱匿性和魯棒性是互斥的。（魯棒性是抗攻擊性的學術名字）

二、頻域製作數字盲水印的方法

信號是有頻率的，一個信號可以看做是無數個不同階的正弦信號的的疊加。

上式爲傅里葉變換公式，是指時域信號（對於信號我們說時域，因爲是與時間有關的，而圖像我們往往說空域，與空間有關），是指頻率。想要對傅里葉變換有深入瞭解的同學，建議看一下《信號與系統》或者《數字信號處理》的教材，裏面系統介紹了傅里葉變換、快速傅里葉變換、拉普拉斯變換、z變換等。

簡而言之，我們有方法將時域信號轉換成爲頻域，同樣，我們也能將二維信號（圖像）轉換爲頻域。在上文中提到，圖像的頻率是指圖像灰度變換的強烈情況。關於此方面更系統的知識，參見岡薩雷斯的《圖像處理》。

下面以傅里葉變換爲例，介紹通過頻域給圖像添加數字盲水印的方法。注意，因爲圖像是離散信號，我們實際用的是離散時間傅里葉變換，在本文采用的都是二維快速傅里葉變換，快速傅里葉變換與離散時間傅里葉變換等價，通過蝶型歸併的手段，速度更快。下文中傅里葉變換均爲二維快速傅里葉變換。

上圖爲疊加數字盲水印的基本流程。編碼的目的有二，一是對水印加密，二控制水印能量的分佈。以下是疊加數字盲水印的實驗。

這是原圖像，尺寸300*240

之後進行傅里葉變換，下圖變換後的頻域圖像，

這是我想加的水印，尺寸200*100，

這是我編碼後的水印，編碼方式採用隨機序列編碼，通過編碼，水印分佈到隨機分佈到各個頻率，並且對水印進行了加密，

將上圖與原圖的頻譜疊加，可見圖像的頻譜已經發生了巨大的變化，

之後，將疊加水印的頻譜進行傅里葉逆變換，得到疊加數字水印後的圖像，

肉眼幾乎看不出疊加水印後的圖像與原圖的差異，這樣，數字盲水印已經疊加到圖像中去。

實際上，我們是把水印以噪聲的形式添加到原圖像中。

下圖是在空域上的加水印圖與原圖的殘差（調整了對比度，不然殘差調小看不見），

可以看出，實際上上述方法是通過頻域添加冗餘信息（像噪聲一樣）。這些噪聲遍佈全圖，在空域上並不容易破壞。

最終，均方誤差（MSE）爲0.0244 信噪比（PSNR）爲64.2dB

那麼，爲什麼頻譜發生了巨大的變化，而在空域卻變化如此小呢？這是因爲我們避開了圖像的主要頻率。下圖是原圖頻譜豎過來的樣子，其能量主要集中在低頻。

水印提取是水印疊加的逆過程，

經提取後，我們得到如下水印，問：爲什麼水印要對稱呢？嘿嘿，大家想想看。

三、攻擊性實驗

本部分進行攻擊性實驗，來驗證通過頻域手段疊加數字盲水印的魯棒性。

1.進行塗抹攻擊，這是攻擊後的圖片：

再進行水印提取：

2.進行剪切攻擊，就是網上經常用的截圖截取一部分的情況：

進行循環補全：

提取水印：

3.伸縮攻擊（這個實驗明碼做的，水印能量較高，隱匿性不強）：

提取水印（水印加的不好，混頻挺嚴重的）：

4.旋轉攻擊（明碼）：

提取水印：

5.JPEG壓縮後（這個實驗我好像是拿明碼做的，能量主要加在了高頻）：

提取結果：

6. PS 4像素馬賽克/均值濾波等，攻擊後圖像

提取水印後圖像：

7.截屏，

截屏後我手動摳出要測試的圖像區域，並且抽樣或者插值到原圖尺寸：

測試結果：

8. 亮度調節（明碼）：

水印提取：

9.色相調節（明碼）：

水印提取：

10.飽和度調節（明碼）：

水印：

11.對比度（明碼）：

水印：

12. 評論區用waifu2x去噪後圖片：

解水印：

13.美圖秀秀，我對我女票一鍵美顏，美白，磨皮，加腮紅，加脣彩（有一種很羞恥的感覺，捂臉）：

提取水印：

14. 對於背景純色的圖其實也是無所謂的

能量係數爲10時加水印圖片：覺得太顯噪就把能量係數調低，不過水印的隱祕性和魯棒性是互斥的

最終提取出的水印：

15.我用將RGB>600的像素設置成爲(0，255，0)來模擬PS魔術手，

提取水印爲：

16.屏攝，好吧，這個實驗我做哭了

屏攝圖：

實驗結果：

我把水印能量係數調整到2000都沒有用。

屏攝之後與原圖信噪比爲4dB左右，我用多抽樣濾波的方式試過，濾不掉屏攝引入的噪聲。屏攝不僅引入了椒鹽噪聲，乘性噪聲，還有有規律的雪花紋理（摩爾紋）。

四、總結

基於頻域的盲水印方法隱藏性強，魯棒性高，能夠抵禦大部分攻擊。但是，對於盲水印算法，魯棒性和隱匿性是互斥的。

本文方法針對屏攝不行，我多次實驗沒有成功，哪位大神可以做一下或者討論討論。還有二值化不行，這是我想當然的，覺得肯定不行所以沒做實驗。其他的我試了試，用給出的方法調整一下能量係數都可以。

我想大家最關心的是什麼最安全，不會被追蹤。

不涉及圖像的都安全，比如拿筆記下來。

涉及圖像的屏攝最安全，截屏十分不安全。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

最新文章

最新評論文章