原创 任務5 LightGBM模型的嘗試

Article directory單模型LightBGM理論Histogram算法帶深度限制的Leaf-wise的葉子生長策略LightGBM實踐自己設定參數GridSearchCV調參模型融合 單模型 LightBGM理論 Li

原创 初識opencv

文章目錄1.什麼opencv,它的優勢點2.opencv安裝和環境配置3.瞭解數字圖像的基本概念:像素、彩色圖像、灰度圖像、二值圖像、圖像算數操作4.練習numpy中array的基本操作5.練習圖像的加載、保存、以及算術操作參考文

原创 李宏毅機器學習10(CART)

文章目錄迴歸樹迴歸樹生成分類樹基尼指數樹的剪枝 迴歸樹 迴歸樹和分類樹都是決策樹的一種,但是迴歸樹用平方誤差最小化準則進行特徵選擇,來生成二叉樹,而分類樹則是用基尼指數(Gini index)最小化準則 迴歸樹生成 假設X與Y分別

原创 李宏毅機器學習9(matplotlib畫決策樹)

導入包和對應的結點 import matplotlib.pyplot as plt decisionNode=dict(boxstyle="sawtooth",fc="0.8") leafNode=dict(boxstyle="r

原创 李宏毅機器學習3(HW1)

文章目錄作業1:預測PM2.5的值hw1要求:hw_best 要求:數據介紹:具體代碼 作業1:預測PM2.5的值 在這個作業中,我們將用梯度下降方法預測PM2.5的值 hw1要求: 1、要求python3.5+ 2、只能用(

原创 李宏毅機器學習5(P9)

文章目錄一.推導LR損失函數二.學習LR梯度下降三.利用代碼描述梯度下降(選做)四.Softmax原理五.softmax損失函數六.softmax梯度下降 一.推導LR損失函數 邏輯迴歸的函數是 fw,b(x)=σ(∑iwixi+

原创 李宏毅機器學習6(個人自己創建數據,利用邏輯迴歸實現分類任務)

文章目錄導入的包邏輯迴歸代碼數據(自己造的)對數組進行分組實際操作代碼 感覺很不錯,我後續看看怎麼可以改善 導入的包 import numpy as np import matplotlib.pyplot as plt 邏輯迴歸

原创 李宏毅機器學習7(Additional References(熵的理解))

文章目錄一. 熵的概念1.1 信息熵1.2 交叉熵1.3 相對熵計算數據集的shangnonEnt參考文獻 一. 熵的概念 1.1 信息熵 信息量對於這個事情判斷的能提供的信息度。 而其實信息熵是信息量的期望(均值),它不是針對每

原创 李宏毅機器學習2(P4-P7)

文章目錄理解偏差和方差學習誤差爲什麼是偏差和方差而產生的(數學公式推導)過擬合,欠擬合,分別對應bias和variance什麼情況學習鞍點,複習上次任務學習的全局最優和局部最優解決辦法有哪些梯度下降學習Mini-Batch與SGD

原创 李宏毅機器學習8(Decesion Tree(決策樹))

文章目錄一.1.1決策樹模型結構1.2決策樹遞歸思想二.2.2信息增益2.2信息增益率三.3.1 ID3算法3.2 C4.5算法四4.1劃分數據集4.1選擇最好的數據集劃分方式4.3創建樹的代碼 一. 1.1決策樹模型結構 分類決

原创 李宏毅機器學習4(P8)

文章目錄一. 從基礎概率推導貝葉斯公式,樸素貝葉斯公式(1)1.1基本概率公式1.2貝葉斯公式1.3樸素貝葉斯公式二. 學習先驗概率(2)三. 學習後驗概率(3)四. 學習LR和linear regression之間的區別(4)五

原创 李宏毅機器學習1

文章目錄一. 機器學習:二. 學習中心極限定理,學習正態分佈,學習最大似然估計2.1推導迴歸Loss function2.2損失函數與凸函數之間的關係2.3全局最優和局部最優三. 學習導數,泰勒展開3.1推導梯度下降公式3.1梯度下降

原创 任務五 LightGBM模型的嘗試

Article directoryLightBGM理論Histogram算法帶深度限制的Leaf-wise的葉子生長策略LightGBM實踐自己設定參數GridSearchCV調參 LightBGM理論 LightGBM 是一個輕量級

原创 任務4 LR+SVM模型的嘗試

邏輯迴歸 理論 面對一個分類問題,我們用線性迴歸的模型來進行進行分類(注意雖然有迴歸兩個字,但是邏輯迴歸解決的是分類問題)。線性迴歸會得到一個具體的數值,然後我們會通過一個激活函數,一般採用Sigmoid函數(因爲這個函數曲線光滑)將

原创 任務3 word2vec詞向量原理與實踐

Word2Vec的定義 在講述 Word2vec 之前,先說NLP (自然語言處理)。NLP 裏面,最細粒度的是 詞語,詞語組成句子,句子再組成段落、篇章、文檔。所以處理 NLP 的問題,首先就要拿詞語開刀。 先舉個例子,判斷一個詞的