【研究方向】可應用於網絡安全的神經符號(Neural-Symbolic)學習算法
網絡安全的許多問題(惡意檢測、隱私權限、欺詐檢測、取證分析等)都可以看做高階的智能標籤判定問題,傳統的機器學習方法雖然可以勝任這類分類任務,但是由於網絡安全問題的異常樣本少、泛化樣本多,因此擅長擬合分佈的傳統算法在真實場景下易錯判/漏判;神經符號(Neural-Symbolic)學習算法是我博士期間希望深入研究的一個方向,並且已經取得了一些階段性的成果,這種結合深度學習和符號推理的算法可以兼具強擬合能力和高階邏輯推理能力,以至於能夠超越數據集,成爲更好“理解”網絡安全問題的檢測算法。
研究方法設想
首先基於各種網絡安全的數據集(比如公開的KDD 99/HTTP CSIC 2010或者真實的其他數據集),建立其符號圖譜形式的表徵(比如知識圖譜),接下來需要對圖譜的總體結構和局部細節進行Embedding的方法,即映射到一個實向量特徵空間(比如運用GCN等圖嵌入方法),到這一步就分別得到了網絡安全歷史數據的符號表徵和數值表徵;
接下來是建立更深層次的映射(可以是深度學習網絡或者其他映射算法比如多項式或者矩陣)來構造算子空間,使得數據集中的每個基本概念實體是可運算實現變換的(如圖,比如某個指令會被計算出是非法的,或者某個IP是和這個判定相關的),這相當於就建立了在網絡安全知識領域的推理算法。
以上就是整個框架的簡述,而如何構造有效的圖Embedding算法和算子構造算法即需要詳細研究的問題。