原创 機器學習(6)SVM

SVM有嚴格的數學證明,但挺複雜,我僅粗略地寫下這篇文章。 用一個二維空間裏僅有兩類樣本的分類問題來舉個小例子。假設我們給定了下圖左圖所示的兩類點Class1和Class2(也就是正樣本集和負樣本集)。我們的任務是要找到一個線,把他們劃分

原创 機器學習(8)決策樹

決策樹生成是一個遞歸過程,是一種簡單高效並且具有強解釋性的模型,廣泛應用於數據分析領域。其本質是一顆由多個判斷節點組成的“樹”。 有一堆水果,其中有香蕉,蘋果,杏這三類,現在要對它們分類,可以選擇的特徵有兩個:形狀和大小,其中形狀的取值有

原创 Tensorflow從入門到禿頂(3)

Tensorflow提供填充機制,可以在構建圖的時候使用placeholder臨時替代任何操作的張量,在調用Session對象的run時再執行,使用填充數據作爲調用參數,調用結束後,填充數據就消失。 一段性感的代碼: import t

原创 機器學習(9)貝葉斯分類

先來看一個例子: 假設廣東娛樂大學裏面男生和女生人數比例是3:1,男生中留長髮的比例是10%,女生留長髮的比例是80%。現在隨機觀測到N個留長髮的學生的背影,推論這N個學生中女生的比例。 這裏假設學校總人數是U人,P(男)表示U

原创 強化學習導論(2)多臂賭博機

本書的這一部分的第一章描述了強化學習問題的特例,其中只有一種狀態,叫做老虎機問題。第二章描述了我們在整個有限馬爾可夫決策過程中所討論的一般問題的表述及其主要思想,包括貝爾曼方程和值函數。接下來的三章描述了求解有限馬爾可夫的三類基本方法。決

原创 Tensorflow從入門到禿頂(2)

Variable是一種特殊的數據,它在途中有固定的位置,不像普通張量那樣可以流動,創建變量張量,使用tf.Variable()構造函數,這個構造函數需要一個初始值,初始值的形狀和類型決定了這個變量的形狀和類型。 如:state = tf.

原创 tensorflow從人們到昇仙(1)

tensorflow的hello world 來一段性感的代碼: import tensorflow as tf import numpy as np #創建數據 x = np.random.rand(200).astype(np.

原创 用強化學習做井字棋

井字棋,英文名叫Tic-Tac-Toe,是一種在3*3格子上進行的連珠遊戲,和五子棋類似,由於棋盤一般不畫邊框,格線排成井字故得名。遊戲需要的工具僅爲紙和筆,然後由分別代表O和X的兩個遊戲者輪流在格子裏留下標記(一般來說先手者爲X),任意

原创 強化學習導論(3)有限馬爾可夫決策過程

本章我們介紹有限馬爾可夫決策過程(Finite MDPs),這個問題和賭博機一樣涉及到評估的反饋,但這裏還多了一個方面--在不同的情況作出不同的選擇。MDPs是經典的序列判定決策模型,就是說,你不是作出一個選擇就會馬上獲得reward,和

原创 機器學習(7)K-mean聚類

聚類屬於非監督學習,k-mean是聚類中經典算法。非監督學習即是隻有樣本沒有標籤。 訓練數據集{x(1),x(2),…,x(m)}{x(1),x(2),…,x(m)}(其中x(i)∈Rnx(i)∈Rn)和聚類數量KK(將數據劃分爲KK類)

原创 皮皮陳專用動漫註釋

皮皮陳活力代碼註釋漫畫,搞崩下一個接手項目者心態的註釋 1,運行成功,來段MJ              (__)                  (oo)            /------\/           / | 

原创 Tensorflow從入門到禿頂(4)

Tensorflow中構建神經網絡所需要的神經元函數,包括各種激活函數,卷積函數,池化函數,損失函數,優化器等。 激活函數運行時激活神經網絡中某一部分神經元,將激活信息向後傳入下一層的神經網絡。神經網絡之所以能解決非線性問題(如語音,圖像

原创 矩陣基本運算

原创 強化學習導論(1)帝王引擎的轟鳴聲

Reinforcement Learning:An Introduction翻譯,能力有限,有錯和不清楚的地方請指出來。 因爲孤高才去挑戰 序 人類通過與環境互動學習的想法可能是我們第一次思考學習的本質。嬰兒玩耍時,揮舞着手臂,四處看,

原创 Unity機器學習代理ML-Agents v0.2版本

下載ML-Agents v0.2 下載地址:  https://github.com/Unity-Technologies/ml-agents 發行說明: https://github.com/Unity-Technolo