原创 神經網絡中的sigmoid函數

1、weights、bias 參數學習 我們希望有一種學習算法,它能夠自動地調整網絡中的權重因子和偏置。 但是,我們怎樣才能設計出這樣的算法神經網絡?可以通過學習來解決一些問題。假如,網絡的輸入是從掃描的原始像素數據,亦或是手

原创 sklearn 中的算法選擇圖(中文)

經過翻譯的sklearn算法選擇路徑圖

原创 Python使用wordcloud做詞雲

看着很多好看的詞雲照片,想到Python也可以做這個詞雲。 一 先是安裝Wordcloud模塊,jieba模塊,使用 pip install 模塊名字 二  如果你安裝好了之後,先是按照 網上的代碼來敲的話,毫無疑問你會遇到這個問題

原创 隨機森林(python)

什麼是隨機森林 隨機 森林 是 幾乎 任何 預測 問題 (甚至 非直線 部分) 的固有 選擇 。 它是 一個 相對較 新 的 機器學習 的 策略 ( 在 90 年代產生於 貝爾 實驗室 ) 和 它 可以 幾乎用於 任何方面 。 它 

原创 梯度下降算法

  迴歸(regression)、梯度下降(gradient descent) 本文由LeftNotEasy所有,發佈於http://leftnoteasy.cnblogs.com。如果轉載,請註明出處,

原创 漫談協方差矩陣

一、統計學的基本概念 統計學裏最基本的概念就是樣本的均值、方差、標準差。首先,我們給定一個含有n個樣本的集合,下面給出這些概念的公式描述: 均值: 標準差: 方差: 均值描述的是樣本集合的中間點,它告訴我們的信息是有限的,而標準

原创 正規方程

1. 正規方程前面幾篇文章裏面我們介紹了求解線性迴歸模型第一個算法 梯度下降算法,梯度下降算法最核心的是找到一個學習速率α,通過不斷的迭代最終找到θ0 … θn, 使得J(θ)值最小。今天我們要介紹一個解決線性迴歸模型新的算法 

原创 pandas做數據的清洗

    轉換之後的經緯度的數據出現很多的問題,重複,特殊值,,,所以我就是做了一個簡單的清洗使用 Python裏面的pandas。 #coding:utf8 import pandas as pd import numpy as np

原创 決策樹算法Python代碼實現

決策樹的學習: 目前是想學習用Python語言來實現算法從而來進行數據挖掘和分析,數據挖掘分析是要求一個數據庫,掌握一門語言,和一些必要的算法,目前剛剛開始學習,其實看似很高大上的數據挖掘,也沒有那麼難,希望來這裏的朋友都有所收穫,共勉

原创 奇異值分解的推理及意義

PS:一直以來對SVD分解似懂非懂,此文爲譯文,原文以細緻的分析+大量的可視化圖形演示了SVD的幾何意義。能在有限的篇幅把這個問題講解的如此清晰,實屬不易。原文舉了一個簡單的圖像處理問題,簡單形象,真心希望路過的各路朋友能從不同

原创 電腦管家怎麼關閉右鍵深度加速(小火箭)功能

電腦管家更新之後不知道怎麼回事出現了一個右鍵深度加速功能,讓我很是惱火,所以想了個辦法,去掉這個。 1首先找到註冊表,Windows加R鍵 2然後點擊編輯-查找-QMRealTimeSpeedupShellContextMenuExte

原创 sklearn學習筆記-《模型驗證方法》

模型驗證方法 1.學習率曲線(learn_curve) 2.交叉驗證得分(cross_val_score) 3.驗證曲線(validation_curve) 一.學習率曲線 計算指定的學習器模型在不同大小的訓練集上經過交叉驗證的訓練得分和

原创 樸素貝葉斯算法解析-機器學習實戰(python)

一、樸素貝葉斯算法詳解 樸素貝葉斯算法的關鍵就是這個樸素貝葉斯公式 樸素貝葉斯算法適用於文本分類,最後是要知道,這個文本屬於每一個類別的概率,屬於哪一個類別的概率最大,就是屬於那個類別 所以現在y是類別標籤是下面的classVec,x是

原创 sklearn學習筆記-《超參數優化方法》

超參數: 學習器模型中一般有兩種參數,一種參數是可以從學習中得到,還有一種無法靠數據裏面得到,只能靠人的經驗來設定,這類參數就叫做超參數。 優化超參數: 參數空間是由 1.一個迴歸器或者一個分類器 2.一個參數空間 3.一個搜索或者採樣機

原创 Python做全國房價分析——經緯度的轉換

       現在正在學習使用Python來做數據分析挖掘,先做了一些小的案例,最近做了一個全國各地的房價分析,首先我先是爬取了安居客上面的所有的全國房價的地址,房價,大概五萬條數據,因爲想以熱力圖的形式展現出來,所以 我就是先把這個全