【讀書筆記】《推薦系統(recommender systems An introduction)》第九章針對協同過濾推薦系統的攻擊

原創

2020-02-20 20:56

個人評價：很有意思的一個話題，我在實際工作中也遇到過，不過這本書寫的一般，有點兒“掉書袋”，太學術化、太YY、前提假設條件太強。姑且看看做借鑑吧。

通常推薦系統利用用戶數據的時候，是假定用戶是善良的、誠實的。而攻擊，就只值認爲設法影響系統的結果、性能。

攻擊的維度：1. 針對某個物品，擡高或者降低其評分；2. 針對特定的用戶羣；3. 針對某個系統，然系統推薦不準確，甚至系統崩潰。

所有的攻擊都是通過某種方式（例如：模擬用戶行爲）來向推薦系統中注入某種特定數據來達到目的的。

攻擊類型：

1. 隨機攻擊

向系統中注入隨機數值，從而達到對推薦系統的干擾的目的。

2. 均值攻擊

在隨機攻擊的基礎之上，利用評分均值，構造更加“像”的注入數據

3. 造勢攻擊

比均值攻擊更加高明的地方在於，除了有對目標物品的高評分（或者低平分）之外，還包含了很多熱門物品的高評分，這樣的目的在於：很多用戶的使用記錄也包含了這些熱門物品，注入的數據更容易和用戶形成“近鄰”關係，從而更容易被推薦系統採用，更容易影響到最終的用戶。

4. 局部攻擊

比造勢攻擊更加高明的地方在於，局部攻擊能夠識別出特定的用戶羣體，並據此發生攻擊。——個人評價：識別特定用戶羣，在攻擊中應該很難，除非竊取了推薦系統的部分數據。

5. 針對性的打壓攻擊

與擡高某個物品的評分的目的不同，打壓攻擊是爲了要降低某個物品的評分。方法就是上面的方法，反其道而行之。通常，打壓攻擊更加容易得手——學術界還沒有解釋出爲什麼會存在這種不對稱性。

6. 點擊流攻擊和隱式反饋

手段是模擬用戶在網頁上的操作，來達到注入數據的目的。——個人懷疑，前面五種方法都是怎麼注入數據的？難不成直接修改人家後臺數據庫吧？！

點擊流攻擊通常影響的是“看了這本書的同學很多人也看了那本書”

攻擊對策

1. 提升數據注入成本

2. 自動檢測異常數據，方法因不同系統而各異，如：短時間內同方向大量數據進入、相比其他數據的異常數據進入

保護數據隱私

1. 在正常數據中加入隨機擾動

2. 分佈式存儲——同一個用戶的數據被存在多個地方，即便某一個地方泄露，也不能獲取整個用戶記錄

完。

發佈了167 篇原創文章 · 獲贊 65 · 訪問量 71萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【讀書筆記】《推薦系統(recommender systems An introduction)》第九章 針對協同過濾推薦系統的攻擊