原创 算法--分類算法

文章純屬個人愚見,歡迎指正! 分類:分類就是通過一些學習(監督學習),弄錯一個分類器或者說分類模型,當你把一個參數(數據)放入時,可以告訴你你這參數(數據)應該放到哪個類,類似於貓狗分類。 一:樸素貝葉斯(Naive Bayes, NB)

原创 算法之路--線性迴歸(五)

一:線性迴歸模型的優點: 1.建模速度快,不需要很複雜的計算,在數據量大的情況下依然運行速度很快。 2.可以根據係數給出每個變量的理解和解釋。 3.對異常值很敏感。 二:缺點  1.只能用於擬合線性數據 三:線性迴歸的用處 線性迴歸有很多

原创 算法之路--隨機森林

一:什麼是隨機森林   隨機森林顧名思義,是用隨機的方式建立一個森林,森林裏面由很多的決策樹組成,隨機森林的每一棵決策樹之間是沒有關聯的。在得到森林之後,當有一個新的輸入樣本進入的時候,就讓森林中的每一棵決策樹分別進行一下判斷,看看這個樣

原创 機器學習中一些常用方法的說明

持續更新。。。歡迎批評   很多方法講的都是原理,雖然講的很對,但是看不懂,也不說這個東西是幹嘛用的,就知道使用而使用,知道是用來幹嘛的,纔想去看原理 1.歸一化   防止數據傾斜,導致所佔比重過大。將原始數據線性化的方法轉換到[0 1]

原创 sklearn與其他算法集合使用步驟

原文鏈接:https://www.cnblogs.com/lianyingteng/p/7811126.html 傳統的機器學習任務從開始到建模的一般流程是:獲取數據 -> 數據預處理 -> 訓

原创 邏輯迴歸Logistics--簡述

一、邏輯迴歸的作用 logistic迴歸又稱logistic迴歸分析,是一種廣義的線性迴歸分析模型,常用於數據挖掘,疾病自動診斷,經濟預測等領域。例如,探討引發疾病的危險因素,並根據危險因素預測疾病發生的概率等。以胃癌病情分析爲例,選擇兩

原创 json.decoder.jsondecodeerror unexpected utf-8 bom (decode using utf-8-sig) line 1 column 1 (char 0)

r = requests.post(page_url,headers=headers,data=data_info) import codecs 解決方案1-使用編解碼器模塊 decoded_data=codecs.decode(

原创 算法的作用--分類算法

文章純屬個人愚見,歡迎指正! 分類:分類就是通過一些學習(監督學習),弄錯一個分類器或者說分類模型,當你把一個參數(數據)放入時,可以告訴你你這參數(數據)應該放到哪個類,類似於貓狗分類。 一:樸素貝葉斯(Naive Bayes, NB)

原创 算法的作用--聚類算法

文章純屬個人愚見,歡迎指正! 聚類:把相似的東西放到同一類中去,一個聚類算法通常只需要知道如何計算相似度就可以開始工作了。

原创 算法的作用 --優化算法

注:單純個人愚見,只是大概講個作用,歡迎指正!詳細的網上許多大牛都有解釋。 優化算法種類:     一:最小二乘法  函數真值與估計值之間殘差最小。是一種數學優化技術。利用最小二乘法可以簡便地求得未知的數據,並使得這些求得的數據與實際數

原创 算法之路--樸素葉貝斯(七)

轉載 :https://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html#!comments 樸素貝葉斯分類有一個限制條件,就是特徵屬性必須

原创 算法之路--決策樹

這裏對決策樹講的很清楚。包括實現決策樹的python代碼:https://blog.csdn.net/qq_39384184/article/details/79940305    

原创 算法之路--梯度下降(四)

轉載自鏈接:https://www.jianshu.com/p/c7e642877b0e  加上自己的一部分理解以及修改一些錯誤,歡迎大家批評 梯度下降的場景假設 梯度 梯度下降算法的數學解釋 梯度下降算法的實例 梯度下降算法的實現 F

原创 算法之路--最小二乘法(三)

https://www.zhihu.com/question/37031188

原创 算法之路--極大似然(二)

最大似然估計提供了一種給定觀察數據來評估模型參數的方法,即:“模型已定,參數未知”。簡單而言,假設我們要統計全國人口的身高,首先假設這個身高服從服從正態分佈,但是該分佈的均值與方差未知。我們沒有人力與物力去統計全國每個人的身高,但是可以通