這是中軟杯網絡拓撲故障檢測那個題目的官方講解總結
不打算做了,就發出來供大家參考下,有做出來的大佬還望不吝賜教
-
每組數據都是有噪聲的,根因的位置不確定。雖然後面的報警是根因引起,但由於報警採集間隔等其他原因,並不是完全按時間順序得到報警日誌的。
-
什麼是數據噪聲,有些與密集結點沒啥關係的孤立的不會影響其他節點就是噪聲。可以用熵的方式分析噪聲,還有一些像網卡流量這種高頻的噪聲,要具體分析。
-
根因:這個系統某個節點出現故障,並對其他系統造成錯誤混亂。但如果某個系統節點出錯,但是別的系統節點並沒有來訪問這個出錯節點,他就不是根因,只能是噪聲
-
因果結構學習算法,因果關係算法,結構化算髮,爬山算法 ,都有一些現成算法,基本用不到神經網絡,不會用到tf框架
-
一般一個根因影響一到兩跳的節點,一組數據只有一個根因
-
根因是一組一組找的,不需要合併。不同組之間是有關聯性的,很多都是共因果圖或者因果關係的
-
有必要對無用數據處理,不一定完全依賴於關鍵詞,因爲可能過濾掉很多信息
-
信息論 交叉熵 圖論 有向圖
-
用二分類做異常麻煩
-
一個節點可能有多個報警信息
-
時間序列是很稀疏的一個序列(一般用不到這個特徵),重要的是拓撲信息。
-
系統之間的拓撲關係並不是很大,節點之間的拓撲纔是重點
-
頻率可以作爲一種特徵或者參考,像一些噪音頻率也是很高的,不能太依靠頻率劃分 種特徵或者參考,像一些噪音頻率也是很高的,不能太依靠頻率劃分
-
上次答疑視頻裏提到的評分搜索,結構學習,因果圖,爬山法這些,感覺幾乎沒用,因爲數據太少,得不到足夠信息