大數據系統下的數據安全注意事項

在大數據時代，越大的公司，面臨的數據安全風險越高，簡要而言，主要分爲六個部分：

1. 後臺被黑客攻擊，例如SDK泄漏關鍵服務IP地址；
2. 數據被爬取風險，例如簡歷信息被外界抓取；
3. 內部使用風險，例如採集的用戶數據是否存在泄漏風險；
4. 生態公司風險，例如收購的公司數據安全規範能夠達成一致；
5. 開放數據風險，例如敏感數據泄漏等；
6. 監督合規風險，例如政府監管部門的要求等。

以Hadoop爲代表的大數據集羣存在如下安全問題：

1. 數據存儲在同一集羣中，非常集中；
2. 分佈式系統天然的複雜性，使得防護變得非常困難；
3. 數據由於BI分析等需求，存在極強的流動性，防護邊界非常寬泛。

在大公司的角度上，數據安全主要需要注意如下三方面：

1. 數據要合法、合理、合規，避免用戶的敏感數據被濫用；
2. 建立完善的數據脫敏機制，評估內部、生態、對外開放三方面的數據風險；
3. 建設完善的防火牆與應用安全機制，應對外部風險，如黑客攻擊、爬取數據等。

當前的前沿數據安全技術：

1. 同態加密：對密文進行計算，適合於那些將數據存儲在雲平臺的公司，但性能消耗十分嚴重；
2. 多方安全計算：多方分享數據進行計算，但性能消耗十分嚴重，且適用場景有限；
3. SGX：通過硬件來保證數據的安全問題，適合線下金融等公司場景；
4. 差分隱私：通過不關聯個體的計算方式，得到整體層面的數據。

大數據集羣中的數據安全措施：

1. 敏感數據定義：通過打標籤的形式，規定哪些數據是敏感信息；
2. 建立權限控制機制：對於訪問數據的用戶權限進行嚴格的定義；
3. 敏感數據的展示需要脫敏，包括：前綴保留、截斷、隱藏、枚舉、哈希、移位、置換、差分隱私、K-匿名、L-多樣性等；
4. 異常數據訪問信息監控，包括：點異常、聚集異常、情景異常等；
5. 數據提取流程：數據採集層打標籤、數據分析層搭建隔離測試環境、數據應用層添加異常行爲檢測、產品對接進行數據安全審計等。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

大數據系統下的數據安全注意事項

HTML頁面關於高分屏的設置

北歐瑞典挪威芬蘭瑞士TikTok海外網紅與YouTube博主的合作模式

歐洲英國德國法國TikTok與YouTube海外網紅達人的完美合作策略

druid數據源 xml配置

天下數據，唯快不破

開源組件系列（4）：分佈式消息隊列（Kafka）

開源組件系列（7）：分佈式結構化存儲（HBase）

有關大型數據倉庫三大痛點的個人看法

開源組件系列（10）：集羣化服務資源管理系統（Mesos）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結