大數據系統下的數據安全注意事項

在大數據時代,越大的公司,面臨的數據安全風險越高,簡要而言,主要分爲六個部分:

        1. 後臺被黑客攻擊,例如SDK泄漏關鍵服務IP地址;
        2. 數據被爬取風險,例如簡歷信息被外界抓取;
        3. 內部使用風險,例如採集的用戶數據是否存在泄漏風險;
        4. 生態公司風險,例如收購的公司數據安全規範能夠達成一致;
        5. 開放數據風險,例如敏感數據泄漏等;
        6. 監督合規風險,例如政府監管部門的要求等。

以Hadoop爲代表的大數據集羣存在如下安全問題:

        1. 數據存儲在同一集羣中,非常集中;
        2. 分佈式系統天然的複雜性,使得防護變得非常困難;
        3. 數據由於BI分析等需求,存在極強的流動性,防護邊界非常寬泛。

在大公司的角度上,數據安全主要需要注意如下三方面:

        1. 數據要合法、合理、合規,避免用戶的敏感數據被濫用;
        2. 建立完善的數據脫敏機制,評估內部、生態、對外開放三方面的數據風險;
        3. 建設完善的防火牆與應用安全機制,應對外部風險,如黑客攻擊、爬取數據等。

當前的前沿數據安全技術:

        1. 同態加密:對密文進行計算,適合於那些將數據存儲在雲平臺的公司,但性能消耗十分嚴重;
        2. 多方安全計算:多方分享數據進行計算,但性能消耗十分嚴重,且適用場景有限;
        3. SGX:通過硬件來保證數據的安全問題,適合線下金融等公司場景;
        4. 差分隱私:通過不關聯個體的計算方式,得到整體層面的數據。

大數據集羣中的數據安全措施:

        1. 敏感數據定義:通過打標籤的形式,規定哪些數據是敏感信息;
        2. 建立權限控制機制:對於訪問數據的用戶權限進行嚴格的定義;
        3. 敏感數據的展示需要脫敏,包括:前綴保留、截斷、隱藏、枚舉、哈希、移位、置換、差分隱私、K-匿名、L-多樣性等;
        4. 異常數據訪問信息監控,包括:點異常、聚集異常、情景異常等;
        5. 數據提取流程:數據採集層打標籤、數據分析層搭建隔離測試環境、數據應用層添加異常行爲檢測、產品對接進行數據安全審計等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章