原创 機器學習建模全流程及資料總結(4)

五. 結果分析 結果分析我們包含兩部分,一是訓練過程的分析,二是模型效果的分析。 5.1 模型誤差評估 關於偏差和方差的問題不再敘述,偏差和方差是統計模型必有,除了增加數據以外,主要還是通過調整模型的超參來降低偏差和方差。 調參問題——網

原创 機器學習建模全流程及資料總結(3)

書接上文。 四. 模型實驗 這裏我們補充一些數據分析的東西。 1. 數據分析及可視化相關 熟悉pandas的操作 matplotlib/ seaborn 可視化分析 (數據科學學習手札62)詳解seaborn中的kdeplot、rugpl

原创 10.2 動態規劃算法套路及空間優化 —— Climbing Stairs & Unique Paths

這一篇文章從最簡單的動態規劃題目開始,結合上一節動態規劃三要素,以LeetCode兩道基礎的DP題目闡述DP問題的基本套路解法。   70. Climbing Stairs You are climbing a stair case. I

原创 10.5.2 (python) 動態規劃字符串類LeetCode題目 —— Interleaving String & Distinct Subsequences

下面我們看兩道字符串子序列的問題 subsequence,首先明白子序列是不必連續的。 97. Interleaving String Given s1, s2, s3, find whether s3 is formed by the

原创 python數據結構與算法學習路線及系列文章彙總(持續更新。。)

雖然是用python搞機器學習的大項目,還是要從零開始學習數據結構那一套理論。不知不覺數據結構及算法系列的學習及LeetCode刷題已經一大堆,現對此彙總。 如下是一套比較合理的完整的學習路徑: 1)數據結構與算法的理論,包括複雜度的思想

原创 LeetCode刷題指南——題目精選3

7. 二叉樹遍歷 樹的概念,樹的存儲結構,孩子兄弟存儲方式 二叉樹、完全二叉樹的性質 深度優先、廣度優先遍歷即先序中序後序層次遍歷的遞歸和非遞歸寫法(相當於6道題) 101. Symmetric Tree 111. Minimum Dep

原创 10.4.2 (python) 動態規劃專題之換零錢 —— Coin Change & Perfect Squares

換零錢是一個典型的動態規劃場景。 322. Coin Change You are given coins of different denominations and a total amount of money amount. Wr

原创 LeetCode刷題指南——題目精選2

這是LeetCode經典題目總結文章~第二篇 4. 二分查找 熟練掌握二分查找的通用格式,包括遞歸及非遞歸的寫法; 33. Search in Rotated Sorted Array 34. Find First and Last Po

原创 10. 1 動態規劃及貪心算法概述

這一章介紹兩個重要的算法思想:動態規劃和貪心。 談到算法思想,前面已經涉及到的包括,遞歸,分治,當然暴力求解也是一種算法思想(關於算法思想的知識框架,可以參考算法書籍),但是許多問題最優解暴力實在解決不了或者效率低下,不夠優美,這樣就引出

原创 10.6 貪心算法詳解及LeetCode題目

可參考幾篇博客 詳解貪心算法(Python實現貪心算法典型例題) 五大常用算法之一:貪心算法   算法概述 貪心算法(又稱貪婪算法)是指,在對問題求解時,總是做出在當前看來是最好的選擇。也就是說,不從整體最優上加以考慮,所做出的是在某種意

原创 10.4.3 (python) 動態規劃專題之股票買賣 —— Best Time to Buy and Sell Stock

這一系列涉及到LeetCode中幾道關於股票stock買賣時機的題目,給出一數組,代表每天股票的價格,我們要按要求,計算你所能獲取的最大利潤。需要注意的是,你不能同時參與多筆交易(你必須在再次購買前出售掉之前的股票)。 Say you h

原创 10.3.1 (python) 動態規劃數組類LeetCode題目 —— Minimum Path Sum & Triangle & Maximum Product Subarray

這一節的幾篇,都是解析動態規劃數組類題目,相對於後面的字符串類問題來說,還是比較容易的。 首先來看比較幾個簡單的DP題目,鞏固一下前面所學套路。 64. Minimum Path Sum Given a m x n grid filled

原创 10.5.1 (python) 動態規劃字符串類LeetCode題目 —— Edit Distance & Regular Expression Matching

下面學習幾道字符串的題目,難度一般較大,但是也有共性,有套路,必須掌握幾道經典的題目。   72. Edit Distance Given two words word1 and word2, find the minimum numbe

原创 機器學習建模全流程及資料總結(2)

書接上文。機器學習建模全流程及資料總結——以文本分類風控建模實驗爲例(1) 4. 特徵篩選 前述特徵工程的工作從原始數據中提取,構造了衆多特徵,一般來說是可以直接用於模型訓練的。 但是對於機器學習模型來說,並不是特徵越多越好。特徵中冗餘的

原创 機器學習建模全流程及資料總結——以文本分類風控建模實驗爲例(1)

  場景爲根據用戶手機短信的風控建模,以此爲例總結一套數據處理,特徵工程,實驗及結果分析的全流程珍貴的代碼,並把常用的工具包函數記錄清楚,免得每次用都要百度。 系列文章包括以下部分: 數據預處理 特徵工程 數據存儲 模型實驗 結果分析