原创 2014年百度機器學習崗位筆試題

3算法題: 1)求兩個有序數組A和B的中位數,m、n爲兩個數組的長度,時間複雜度爲O(log(m+n)) 比較A[m/2] 和 B[n/2]大小,處理不同的比較結果 2)x-y座標系中有一些點,估計這些點中的兩兩的最大長度 先求所有點的中

原创 從協方差矩陣到PCA

在已知樣本的情況下使用樣本的統計量去估計隨機變量的數字特徵(期望、方差、標準差)。 設x1,x2,...,xN是來自總體隨機變量X的一個樣本,xi爲d維的向量。 樣本均值:X_mean = 1/N*ΣXi,它是隨機變量X均值的無偏估計

原创 交朋友---2014亞馬遜機試第1題

解題思路: 將輸入的關係放入鄰接矩陣中,有關係則用1表示,將兩個鄰接矩陣相乘,矩陣中的值表示對應的guest1到guest2的路徑數,1表示只有一條路徑,2表示有兩條路徑,其中的路徑數就是題目中的common friends 數。 源代

原创 最大似然和EM算法

從最大似然到EM算法淺解 機器學習十大算法之一:EM算法。能評得上十大之一,讓人聽起來覺得挺NB的。什麼是NB啊,我們一般說某個人很NB,是因爲他能解決一些別人解決不了的問題。神爲什麼是神,因爲神能做很多人做不了的事。那麼EM算法能解

原创 查普曼-科莫高洛夫方程Chapman–Kolmogorov equation

p(xt | z1:t-1) = f p(xt | xt-1, z1:t-1)P(xt-1 | z1:t-1)dxt-1 根據馬爾科夫假設,當前的狀態只與前一時刻的狀態有關,與歷史觀測值無關,通常去掉,z1:t-1,f表示積分 查普曼-科

原创 動態規劃

 動態規劃思考的問題:       1、問題如何分解,即最終問題的上一步驟是什麼,如求組合C(n, k) = C(n-1, k-1) + C(n-1, k-1)。       2、參數確定,寫出遞推式。找到最後一步的子問題,確保符合“子問

原创 SVD奇異值分解

前言:     上一次寫了關於PCA與LDA的文章,PCA的實現一般有兩種,一種是用特徵值分解去實現的,一種是用奇異值分解去實現的。在上篇文章中便是基於特徵值分解的一種解釋。特徵值和奇異值在大部分人的印象中,往往是停留在純粹的數學

原创 最長公共子序列

求最長公共子序列的長度: if A[n] == B[m] LCS_len(A[1...n], B[1...m]) = LCS_len(A[1...n-1], B[1...m-1]) + 1  if A[n] != B[m] LCS_len

原创 數學之美筆記2

如何確定網頁和查詢的相關性 某個網頁與某個查詢的相關性=TF1*IDF1 + TF2*IDF2 + ....+ TFN*IDFN TFi是查詢中關鍵字i的詞頻,IDFi爲關鍵字i的重要性權重---逆文本詞頻指數。 總之,給定一個查詢,有關

原创 機器學習中的過擬合和防止過擬合

過擬合:指學習時選擇的模型所包含的參數過多,已致於出現這一模型對已知數據預測得很好,但對未知數據預測得很差的現象。 “一個過配的模型試圖連誤差(噪音)都去解釋(而實際上噪音又是不需要解釋的),導致泛化能力比較差,顯然就過猶不及了。”

原创 inline關鍵字

一、inline關鍵字用來定義一個類的內聯函數,引入它的主要原因是用它替代C中表達式形式的宏定義。 #define ExpressionName(Var1,Var2) ((Var1)+(Var2))*((Var1)-(Var2))

原创 半監督學習

目前,國內的南京大學周志華老師是這方面的泰斗,寫了很多這方面牛的文章,可以參考一下他的主頁:http://cs.nju.edu.cn/zhouzh/。。下面貼出來的文章出自周老師之手,通俗易懂。受益匪淺。。 1. 引言      

原创 最長的相交線段---2014亞馬遜機試第2題

判斷連個線段是否相交,分爲兩步: (1).快速排斥試驗 設以線段 P1P2 爲對角線的矩形爲R, 設以線段 Q1Q2 爲對角線的矩形爲T,如果R和T不相交,顯然兩線段不會相交; (2).跨立試驗 如果兩線段相交,則兩線段必然相互跨立對

原创 三種算法求解一個數組的子數組最大和

三種算法求解一個數組的子數組最大和 題目:要求一個數組連續下標和的最大值,數組的元素可正、可負、可爲零,例如-2,5,3,-6,4,-8,6將返回8。 這題是很經典的一道面試題,也有各種解法,從算法分析上,時間複雜度也有很大差別,下面

原创 貝葉斯網絡資料

Bayesian network 與python概率編程實戰入門 https://github.com/memect/hao/blob/master/awesome/bayesian-network-python.md 點