原创 深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT條件

在求取有約束條件的優化問題時,拉格朗日乘子法(Lagrange Multiplier) 和KKT條件是非常重要的兩個求取方法,對於等式約束的優化問題,可以應用拉格朗日乘子法去求取最優值;如果含有不等式約束,可以應用KKT條件去求取。當然

原创 優化程序性能

編寫高效的程序需要以下活動:    1:選擇合適的算法和數據結構---算法優化    2:必須編寫出編譯器能夠有效優化及轉化成高效執行代碼的源代碼---程序優化    3:大量數據採用並行計算    4:指令優化 程序優化的具體方法:  

原创 機器學習之 損失函數和風險函數

損失函數      監督學習問題是在假設的空間F中選取模型 f 作爲決策函數,對於給定的輸入 X,由 f(x) 給定輸出Y, 這個輸出的預測值與真實值 Y可能不一致,用一個函數來度量預測錯誤的程度表示這種不一致,這個函數就是損失函數或者

原创 flink 內存管理

Flink 的內存一個task中的內存分配; 首先 先從container 截取一部分內存,這部分內存暫定位cutoff部分,這部分內存是保證系統的運行,可以提供給其他jvm使用 其經過配置文件 containerized.heap-cu

原创 sparkMlib實現協同過濾算法

協同過濾常被應用於推薦系統。這些技術旨在補充用戶-商品關聯矩陣中所缺失的部分。MLlib當前支持基於模型的協同過濾,其中用戶和商品通過一小組隱語義因子進行表達,並且這些因子也用於預測缺失的元素。爲此,我們實現了交替最小二乘法(ALS) 

原创 邏輯Logistic迴歸原理和實現

    首先申明:引用此博客爲學習記錄用,中間引用了Andrew NG的視頻內容和Z老師的授課內容,因個人能力有限若有不足的地方,歡迎大家提出一起研究學習;     第一我們先給予邏輯迴歸的定義:邏輯迴歸(Logistic Regress

原创 SparkMlib實現線性迴歸

關於線性迴歸的原理請參考Coursera上斯坦福大學Andrew Ng教授的“機器學習公開課” 下面直接到sparkMlib實現線性迴歸,spark源碼下有兩個關於機器學習的包,一個是基於RDD的包Mlib-support the RDD