非負譜分析用於特徵選擇

文章原名爲:Unsupervised Feature Selection Using Nonnegative Spectral Analysis

前人的研究基礎爲利用譜分析法進行特徵聚類,然後進行特徵選擇,並且沒有約束F的非負和正則

文章是同時進行特徵聚類和特徵選擇,目標函數爲:

 

其中,樣本數爲N;分類的類別數爲C;特徵數爲d;F是聚類標籤,N*C維的矩陣,F=[f1,f2,f3...fn]‘而後歸一化的結果,如果fij非0,就表示第i個樣本屬於第j個類別。fi爲C*1的行向量屬於{0,1};比如 Y=[1,0;0,1;0,1],F=[1.0000 0;0  0.7071;0 0.7071];
W爲特徵選擇矩陣(*N),W儘量行稀疏,Wij表示第j個樣本的第i個特徵,若W(i:)表示樣本的第i個特徵,趨近於0,則表示第i個特徵與聚類標籤矩陣F無關。

目標函數的第一部分的最小化,可以保證譜聚類的正確聚類,與標籤標記的特徵將會被選擇;第三部分最小化,可以保證W的行稀疏,去除噪聲和不相關項。

第二部分是F和W的互相調節,旨在學習聚類標籤F和特徵選擇W矩陣。第四部分是保證F的正則。

第一部分:譜分析法,也叫特徵值法,先求K近鄰圖的帶權領接矩陣,再求拉普拉斯矩陣L

求目標函數最小化的F,W,使用迭代法。

X是d*n維矩陣、初始化Fn*c維、Dd*d維單位矩陣

迭代步奏:

其中,=100;r=10^8;a=1;迭代20次後求得此時的F和W,這個迭代的過程在matlab裏觀察,F沒有變化,我想原因應該是系統r=10^8,太大,F‘F=Ic,所以F幾乎每次沒有變化。實驗的特徵選擇過的聚類結果和未進行特徵選擇的結果,相差不大,幾乎一樣。。很鬱悶,到底哪裏有問題呢,文章應該沒有問題啊,是我 理解的問題吧。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章