原创 周志華書面試總結(第三篇)

面試總結

原创 周志華書面試總結(第一篇)

馬上就要找實習了,對西瓜書常見問題的總結

原创 大數據面試總結(第一篇)

問題一:TOPk問題 問題二:海量日誌數據,提取出某訪問百度次數最多的那個IP? 問題三:給定a,b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a,b文件共同的url? 問題四:在2.5億個整數中

原创 一文看懂神經網絡剪枝算法

1. 問題敘述   心血來潮寫點最近做的成果,主要分成兩個博客來進行闡述。研究生上了一年半看了不少關於剪枝神經網絡方面的文章,但是有很少的文章能讓人感覺到耳目一新,打通了任督二脈的感覺。前段時間看到了一個剪枝算法就有這種感覺。和大家分享

原创 周志華書面試總結(第五篇)

問題18:ID3該樹模型可以重複使用特徵嗎?ID3使用什麼原則進行選擇特徵? 問題19:C4.5使用什麼原則進行選擇特徵的?怎樣進行剪枝操作? 問題20:CART樹挑選特徵的準則?迴歸樹和分類樹分開進行介紹?信息增益,信息增益比,基尼

原创 解釋logistic迴歸爲什麼要使用sigmoid函數

  這篇博客是在知乎上有個乎友問的問題,我的回答

原创 機器學習算法推導

心血來潮,想將所學到的知識寫篇博客,作者所研究的方向爲機器學習,剛學習的時候,走了很多彎路,看的書不少,在推導機器學習一些算法時候遇到了不少困難,查了不少資料,在剛纔學的時候,有很多公式推導起來很困難,或者說大多數人都會遇到這樣的問題,本

原创 SVM和logistic迴歸的比較

      SVM和logistic迴歸都是比較常用的算法,而這兩個算法有什麼異同點呢。下面是自己的總結,當然也是自己的一些見解。 相同點:        1.都是分類模型        2.都是判別模型 不同點:      

原创 周志華面試總結(第四篇)

問題15:k-means算法具體步驟?有哪些優缺點?改進?用了哪些距離度量? 問題16:有哪些常見的樹?樹模型的優點?樹生成步驟? 問題17:17.熵,條件熵的理解及公式?信息增益的理解?信息增益比要解決的問題?

原创 周志華書面試總結(第二篇)

機器學習周志華問題總結

原创 似然函數與貝葉斯公式

    不知道你是否看過我之前的文章,如果看了的話,你會認爲很爛,然後判斷這篇博客也是很大程度上是很爛的,如果這樣的,很幸運,那你使用了貝葉斯思維方式來進行思考問題了。     學了這麼多年貝葉斯公式,不是很瞭解貝葉斯公式,但是今天和

原创 另一個角度理解嶺迴歸

    今天要寫的博客說簡單也簡單,是大家熟悉的線性模型,但是我們通過線性模型的不足,我們導出嶺迴歸,下面是博客的結構。     1.線性模型     2.線性模型出現的問題     3.改進線性模型—->嶺迴歸的導入 1.線性模型