原创 決策樹算法實現要點

1.定義節點(節點的集合形成樹);即定義一個結構體Point,而 用Point tree[] 來表示樹。 點Point裏面包括name(在該點進行分類的特徵),val(該點父輩的特徵的某個值),n_child(帶點子代的數量),*

原创 2020-03-17

SCI歷程分享-introduction 在這裏簡單的分享一下自己在一篇論文上的簡單分析,新手,勿噴~

原创 2020-03-02

#SCI經歷# 第二篇:今天3.2號,晚上導師看了近三個小時我的初稿後,終於打了電話給我。窗外大雨嘩嘩的下着,我的情緒其實並沒有那麼糟糕,而且早就預料到今晚會聯繫我,但我還是感到非常的不爽(不知道爲什麼)。他給我講了半個小時的電話

原创 NASA數據集

最近在做預測性維護方面的工作,數據集用的是NASA 2008PHM競賽的數據集,在youtube上有些相關該數據集的教程,但還是覺得不夠。真巧看到了matlab主頁上關於預測性維護技術工具箱的文檔,發現它正是使用了我要使用的數據集,同

原创 歡迎使用CSDN-markdown編輯

這裏寫自定義目錄標題歡迎使用Markdown編輯器新的改變功能快捷鍵合理的創建標題,有助於目錄的生成如何改變文本的樣式插入鏈接與圖片如何插入一段漂亮的代碼片生成一個適合你的列表創建一個表格設定內容居中、居左、居右SmartyPants

原创 交叉驗證

本文結構如下: 什麼是交叉驗證? 爲什麼要交叉驗證? 有哪些交叉驗證的方法? 這些方法各有什麼區別? 什麼是交叉驗證 要先明白訓練集與測試集:再機器學習和模式識別的應用中往往需要將數據集分爲訓練集和測試集,前者訓練模型,後者

原创 calibre(電子書管理)軟件的使用

安裝calibre 從calibre官網上下載相應操作系統的安裝包,安裝包不大。 直接打開安裝包進入操作頁面,圖如下:選擇相應的語言和安裝地址,即可下一步。 找到並選擇自己的設備,點擊下一步即可成功安裝。 calibre的使用

原创 噪音樣本對模型產生的影響

什麼是噪音?其實噪音就是難以輕易被區分並對輸出結果產生干擾的那些數據,他們是與衆不同的。 噪音樣本在自然界中是普遍存在的,他被自然的包裹在大量數據集中,正常的數據集很自然的會存在噪音。 但噪音其實是我們不希望存在的成分,因爲他的出現往往會

原创 信息熵的理解

信息熵的定義式                          H(X)= - ,其中=p(X=) ; i=1,2....n 通過以上的式子求和的單項  ,我們可以理解的是他表示x=xi發生的概率爲pi,那麼產生一次x=xi的次數應該

原创 樣本空間的離散化

代碼參考出處https://blog.csdn.net/HackerTom/article/details/78597630 看了以上代碼,對離散化部分作一小結。 需要的三個主要的特徵空間:samspc(樣本 空間),dsc(離散化的空間

原创 第三章k近鄰法

k近鄰法實際上利用訓練數據集對特徵性向量空間進行劃分,並作爲其分類的模型。 3.1k近鄰法算法 (1)根據給定的距離度量,在訓練集中找出與x最鄰近的k個點,涵蓋k個點的x的領域記做Nk(x); (2)在Nk(x)中根據分類決策規則(

原创 決策樹算法實現過程

1.數據的輸入:從文件輸入或者手動輸入 2.數據的整理:建立數據集dataset(vector<vector>),包括數據的條數m和維數n 3.獲得每個屬性(特徵)對應的值(範圍),包括每個類

原创 機器學習--南京--找一起學習的朋友

鄙人南航大四,將在原校繼續讀研,並且方向於機器學習相關,現在希望找一些同在南京並且也對機器學習方向感興趣的同學。 鄙人主要的目的還是交一些可以相互學習的朋友,可以一起討論學術知識,或者對人工智能行業的探討,可以一起組隊參加一些賽事或者創新

原创 第四章樸素貝葉斯法----生成模型

4.1樸素貝葉斯的學習與分類 4.1.1基本方法 聯合概率分佈P(X,Y),獨立同步產生 先驗概率分佈P(Y=ck),k=1,2,…K 條件概率分佈P(X=x|Y=ck)=P(X1=x1,X2=x2,|Y=ck),k=1,2…K,(具

原创 線性代數第二講矩陣消元

1.消元法 method of elimination     高斯消元法:就是對矩陣進行行或列的加減,變換成對角陣的形式。 2.回代 Back substitution 做方程的高斯消元法時可以將係數矩陣加上b擴充爲增廣矩陣,再進行高斯