原创 量化投資學習筆記27——《Python機器學習應用》課程筆記01

北京理工大學在線課程: http://www.icourse163.org/course/BIT-1001872001 機器學習分類 監督學習 無監督學習 半監督學習 強化學習 深度學習 Scikit-learn算法分類 sklearn自

原创 量化投資學習筆記20——迴歸分析:實操,泰坦尼克號乘客生還機會預測,邏輯迴歸方法。

這次嘗試用邏輯迴歸來解決泰坦尼克號的問題。本文參考了https://zhuanlan.zhihu.com/p/28408516 和 https://www.cnblogs.com/BYRans/p/4713624.html 邏輯迴歸(Log

原创 量化投資學習筆記36——《Python機器學習應用》課程筆記09

手寫識別實例,用神經網絡實現。 手寫識別是一個多分類任務,共有10個分類,即0-9。 圖像識別是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術。一般經歷文字識別,數字圖像處理與識別和物體識別。 用DBRHD數據

原创 量化投資學習筆記37——《Python機器學習應用》課程筆記10

用KNN算法來進行數字識別,還是用sklearn自帶的digits數據集。 coding:utf-8 KNN算法實現手寫識別 from sklearn import neighbors from sklearn.datasets impor

原创 量化投資學習筆記34——《Python機器學習應用》課程筆記08

嶺迴歸 解決某些訓練樣本線性相關,導致迴歸結果不穩定的情況。 它是一種用於共線性數據分析的有偏估計迴歸方法。是一種改良的最小二乘估計法。 在sklearn中使用sklearn.linear_model.Ridge進行。 課程的實例是交通流量

原创 量化投資學習筆記32——《Python機器學習應用》課程筆記06

講有監督學習的線性迴歸。 線性迴歸是利用數理統計中的迴歸分析,來確定兩種或兩種以上變量間相互依賴的定量關係的一種統計分析方法。 只有一個自變量的迴歸稱簡單迴歸,大於一個變量的情況稱多元迴歸。 用途:預測、分析變量與因變量關係的強度。 實例:

原创 量化投資學習筆記28——《Python機器學習應用》課程筆記02

降維 PCA算法及其應用 主成分分析(PCA),通常用於高維數據的探索與可視化。可以拔具有相關性的高維變量轉化爲線性無關的低維變量。稱爲主成分,能夠儘可能保存原始數據的信息。 幾個概念 方差:樣本與樣本均值的差的平方和的均值,用來度量一組數

原创 量化投資學習筆記29——《Python機器學習應用》課程筆記03

聚類的實際應用,圖像分割。 利用圖像的特徵將圖像分割爲多個不相重疊的區域。 常用的方法有閾值分割,邊緣分割,直方圖法,特定理論(基於聚類,小波分析等)。 實例:利用k-means聚類算法對圖像像素點顏色進行聚類以分割圖像。 輸出:同一聚類的

原创 量化投資學習筆記25——樸素貝葉斯:實操,泰坦尼克號乘客生還機會預測

參考: https://blog.csdn.net/qian99/article/details/77916806 數據載入和清洗跟前面文章一樣的。 進行樸素貝葉斯模型建模 features = ['Pclass', 'Sex', 'Age

原创 量化投資學習筆記24——貝葉斯方法

隨機試驗:可重複性,可觀察性,不確定性。 條件概率 P(B|A) = P(AB)/P(A),爲事件A發生的條件下事件B的發生概率。 概率乘法公式: P(AB) = P(B|A)P(A) = P(A|B)P(B) 事件獨立:兩事件的發生沒有影

原创 量化投資學習筆記23——支持向量機:實操,泰坦尼克號乘客生還機會預測

用剛學的支持向量機來解決一下泰坦尼克號問題。 數據的載入,清洗完全跟之前的一樣,直接複製粘貼。從建模開始。 代碼 建模,使用SVM模型 劃分訓練集和測試集 predictors = ['Pclass', 'Sex', 'Age', 'Fam

原创 量化投資學習筆記22——迴歸分析:支持向量機

因爲新冠肺炎疫情,診所還沒復工。這是在家用手機敲的,代碼顯示有問題。等復工以後在電腦上改,各位先湊和看吧。 支持向量機(Support Vector Machine, SVM)是一種基於統計學習的模式識別的分類方法,主要用於模式識別。所謂支

原创 量化投資學習筆記21——迴歸分析:邏輯迴歸

阿里雲的課程有邏輯迴歸的內容的,學一下。 原理 分類變量:又稱定性變量或離散變量,觀察個體只能屬於互不相容的類別中的一組。一般用非數字表達。與之相對的是定量變量或連續變量,變量具有數值特徵。 常見的有有序變量(年齡等級,收入等級等),名義變

原创 量化投資學習筆記19——迴歸分析:實操,泰坦尼克號乘客生還機會預測,線性迴歸方法。

用kaggle上的泰坦尼克的數據來實操。 https://www.kaggle.com/c/titanic/overview 在主頁上下載了數據。 任務:使用泰坦尼克號乘客數據建立機器學習模型,來預測乘客在海難中是否生存。 在實際海難中,2

原创 量化投資學習筆記17——迴歸分析:一些問題的處理

數據違背基本假設的處理 常見的問題:異方差,自相關,異常值。 異方差 指隨機誤差項的方差不是一個常數,而是隨着自變量的取值變化而變化。 帶來的問題:①使用最小二乘法(OLE)求解參數時,參數的估計值雖然無偏,但不是最小方差線性無偏估計。②參