原创 信息度量與KL Divergences

信息度量 信息論中,把信息大小解釋爲其不確定度。如果一個事件必然發生,那麼他沒有不確定度,也就不包含信息。即信息=不確定度。 借用數學之美中的一個例子: 馬上要舉行世界盃賽了。大家都很關心誰會是冠軍。假如我錯過了看世界盃,賽後我問一個

原创 iris數據集的讀取,訓練,預測

一 讀取UCI數據集iris.data中數據方法 1.將數據分成五組,一列一列讀進列向量當中>> [attrib1, attrib2, attrib3, attrib4, class] = textread('data\iris.dat

原创 矩陣的內涵

[轉載] 矩陣的內涵 理解矩陣(一) 線性代數課程,無論你從行列式入手還是直接從矩陣入手,從一開始就充斥着莫名其妙。比如說,在全國一般工科院系教學中應用最廣泛的同濟線性代數教材(現在到了第四版),一上來就介紹逆序數這個“前無古人,後

原创 Matlab數據降維工具箱drtoolbox

drttoolbox : Matlab Toolbox for Dimensionality Reduction是Laurens van der Maaten數據降維的工具箱。 裏面囊括了幾乎所有的數據降維算法:  - Princi

原创 非負矩陣分解中基於L1和L2範式的稀疏性約束

L1、L2範式     假設需要求解的目標函數爲:                     E(x) = f(x) + r(x)     其中f(x)爲損失函數,用來評價模型訓練損失,必須是任意的可微凸函數,r(x)爲規範化約束因

原创 距離和相似性度量

距離: 1.      明可夫斯基距離(Minkowski Distance) 公式: 其中p是一個變量,下面的所有距離都是這個公式的特例; p=1就是曼哈頓距離, P=2就是歐式距離,P=無窮時,就是切比雪夫距離.   2.  

原创 矩陣-向量求導法則

複雜矩陣問題求導方法:可以從小到大,從scalar到vector再到matrix。  x is a column vector, A is a matrix $d(A*x)/dx=A$             $d(x^T

原创 矩陣的 Frobenius 範數及其求偏導法則

矩陣的跡求導法則 1. 複雜矩陣問題求導方法:可以從小到大,從scalar到vector再到matrix 2. x is a column vector, A is a matrix d(A∗x)/dx=A

原创 聚類評價指標(一)

外部評價法 外部評價方法意味着評判聚類算法的結果是基於一種預先指定的結構。這種結構反映了人們對數據集聚類結構的直觀認識。每個數據項的分類標記已知。下面介紹兩種常用的 外部評價法。 1) F-measure 它組合了信息檢索中查準率(

原创 弗羅貝尼烏斯範數(Frobenius norm)

弗羅貝尼烏斯範數 對 p = 2,這稱爲弗羅貝尼烏斯範數(Frobenius norm)或希爾伯特-施密特範數( Hilbert–Schmidt norm),不過後面這個術語通常只用於希爾伯特空間。這個範數可用不同的方式定義:

原创 聚類的一些評價指標

什麼是聚類 聚類簡單的說就是要把一個文檔集合根據文檔的相似性把文檔分成若干類,但是究竟分成多少類,這個要取決於文檔集合裏文檔自身的性質。下面這個圖就是一個簡單的例子,我們可以把不同的文檔聚合爲3類。另外聚類是典型的無指導學習,所謂無指

原创 如何用簡單易懂的例子解釋隱馬爾可夫模型?

神經網絡很萌的!0. 分類神經網絡最重要的用途是分類,爲了讓大家對分類有個直觀的認識,咱們先看幾個例子:垃圾郵件識別:現在有一封電子郵件,把出現在裏面的所有詞彙提取出來,送進一個機器裏,機器需要判斷這封郵件是否是垃圾郵件。疾病判斷:病人到

原创 MATLAB工具箱(功能型工具箱和領域型工具箱)

•        MATLAB有三十多個工具箱大致可分爲兩類:功能型工具箱和領域型工具箱.$ B; `: L2 v, Q/ B4 Z" o            功能型工具箱主要用來擴充MATLAB的符號計算功能、圖形建模仿真功能、文字

原创 機器學習(Machine Learning)入門科普

=======================國外==================== Machine Learning 大家(1):M. I. Jordan (http://www.cs.berkeley.edu/~jordan/)

原创 機器學習爲什麼要學習最優化呢?

最優化方法(也稱做運籌學方法)是近幾十年形成的,它主要運用數學方法研究各種系統的優化途徑及方案,爲決策者提供科學決策的依據。最優化方法的主要研究對象是各種有組織系統的管理問題及其生產經營活動。最優化方法的目的在於針對所研究的系統,求得一個