機器學習教程之半監督學習 Coreg 協同迴歸算法 (論文、算法、數據集、代碼)

原創

2020-06-03 22:59

這篇博客介紹的是一篇用於半監督迴歸問題的方法：Semisupervised Regression with
Cotraining-Style Algorithms。這是周志華老師在2007年較早的一篇文章，其特點在於，大多數半監督的算法都是用於分類問題的，而Coreg則以相對較簡單的方式實現了半監督的迴歸。

之前還寫過兩篇半監督分類的算法，見
機器學習教程之半監督學習 Co-training，以及
機器學習教程之半監督學習 Tri-training

此外，一些圖模型也可以用於半監督的分類和迴歸
DeepLearning | 圖注意力網絡Graph Attention Network
DeepLearning | 圖卷積神經網絡(GCN)解析

這些博客都提供了算法的講解和python的代碼復現，感興趣的可以瞭解一下

一、Co-regression (Coreg) 模型

和 Cotraining 類似，Coreg採用的也是兩個學習器相互給無標籤數據打標籤的方法。不同點在於Coreg針對的是迴歸問題。

相比於分類問題，該場景下回歸問題的難點在於如何挑選置信度較高的僞標籤？分類問題很簡單，對於一個樣本點，如果分類器輸出類別的後驗概率足夠高，那麼就可以認爲這個預測是準確的，因而可以將該預測設置爲無標籤數據的僞標籤（詳細見 Co-training）。但是對於迴歸問題而言，迴歸器是沒有後驗概率這一說法的，所以Core的主要貢獻就在於給出了評估預測可靠程度的方法，從而爲無標籤數據提供僞標籤。

Coreg使用了兩個KNN迴歸器，這兩個迴歸器的不同是通過設定不同的距離度量和近鄰數量實現的。對一個迴歸器對一個無標籤樣本 $x_{u}$ 預測的可靠程度的評估，是通過下面的指標來衡量的

上式中， $\Omega_{u}$ 指的是 $x_{u}$ 在有標籤數據集 $L$ 中的近鄰樣本集， $h$ 表示的是該KNN迴歸器， $h^{'}$ 表示的是將 $x_{u}$ 和 $y_{u} =h(x_{u})$ 加入到訓練集以後更新得到的迴歸器。簡單來說 $\delta_{x_{u}}$ 評估的是將該僞標籤加入到訓練集以後對近鄰預測的影響， $\delta_{x_{u}}$ 越大，表示加入該僞標籤對於準確率提升的收益越大，那麼該僞標籤就越有可能是正確的

二、Coreg算法流程

三、模型python代碼

有問題可以私信博主，點贊關注的一般都會回覆，一起努力，謝謝支持。
微信搜索“老和山算法指南”獲取下載鏈接與技術交流羣

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習教程之半監督學習 Coreg 協同迴歸算法 (論文、算法、數據集、代碼)

目錄

一、Co-regression (Coreg) 模型

二、Coreg算法流程

三、模型python代碼

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

DeepLearning | 圖卷積網絡基於拓撲結構的分類（T-GCN）

機器學習教程之半監督學習基於圖正則項的半監督極限學習機

機器學習教程之 EM算法：高斯混合模型聚類算法 (python基於《統計學習方法》實現，附數據集和代碼)

人工智能裏的數學修煉 | 隱馬爾可夫模型：前向後向算法

DeepLearning | Zero Shot Learning 零樣本學習零樣本工業故障診斷

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

機器學習教程 之 半監督學習 Coreg 協同迴歸算法 (論文、算法、數據集、代碼)

目錄

一、Co-regression (Coreg) 模型

二、Coreg算法流程

三、模型python代碼

機器學習教程之半監督學習 Coreg 協同迴歸算法 (論文、算法、數據集、代碼)