台部落猪先生1994

面試總結

2018-09-03 06:49:05

馬上就要找實習了，對西瓜書常見問題的總結

2018-09-03 06:49:05

問題一：TOPk問題問題二：海量日誌數據，提取出某訪問百度次數最多的那個IP? 問題三：給定a,b兩個文件，各存放50億個url,每個url各佔64字節，內存限制是4G,讓你找出a,b文件共同的url? 問題四：在2.5億個整數中

2018-09-03 06:49:05

1. 問題敘述心血來潮寫點最近做的成果，主要分成兩個博客來進行闡述。研究生上了一年半看了不少關於剪枝神經網絡方面的文章，但是有很少的文章能讓人感覺到耳目一新，打通了任督二脈的感覺。前段時間看到了一個剪枝算法就有這種感覺。和大家分享

2018-09-03 06:49:04

問題18：ID3該樹模型可以重複使用特徵嗎？ID3使用什麼原則進行選擇特徵？問題19：C4.5使用什麼原則進行選擇特徵的？怎樣進行剪枝操作？問題20：CART樹挑選特徵的準則？迴歸樹和分類樹分開進行介紹？信息增益，信息增益比，基尼

2018-09-03 06:49:04

這篇博客是在知乎上有個乎友問的問題，我的回答

2018-09-03 06:49:04

心血來潮，想將所學到的知識寫篇博客，作者所研究的方向爲機器學習，剛學習的時候，走了很多彎路，看的書不少，在推導機器學習一些算法時候遇到了不少困難，查了不少資料，在剛纔學的時候，有很多公式推導起來很困難，或者說大多數人都會遇到這樣的問題，本

2018-09-03 06:49:04

SVM和logistic迴歸都是比較常用的算法，而這兩個算法有什麼異同點呢。下面是自己的總結，當然也是自己的一些見解。相同點： 1.都是分類模型 2.都是判別模型不同點：

2018-09-03 06:49:04

問題15：k-means算法具體步驟？有哪些優缺點？改進？用了哪些距離度量？問題16：有哪些常見的樹？樹模型的優點？樹生成步驟？問題17：17.熵，條件熵的理解及公式？信息增益的理解？信息增益比要解決的問題？

2018-09-03 06:49:04

機器學習周志華問題總結

2018-09-03 06:49:03

不知道你是否看過我之前的文章，如果看了的話，你會認爲很爛，然後判斷這篇博客也是很大程度上是很爛的，如果這樣的，很幸運，那你使用了貝葉斯思維方式來進行思考問題了。學了這麼多年貝葉斯公式，不是很瞭解貝葉斯公式，但是今天和

2018-09-03 06:48:36

今天要寫的博客說簡單也簡單，是大家熟悉的線性模型，但是我們通過線性模型的不足，我們導出嶺迴歸，下面是博客的結構。 1.線性模型 2.線性模型出現的問題 3.改進線性模型—->嶺迴歸的導入 1.線性模型

2018-09-03 06:48:35