原创 加速下載安裝各種插件與包

在使用python pip 安裝各種插件和包的時候,經常鏈接的是外網,所以下載速度特別慢。在一位大神的幫助下,得知了一種快速下載的方法:直接通過 阿里雲  來下載這些插件和包使用方法:pip文件:https://download.csdn

原创 00 機器學習 (ML)導論

機器學習 (Machine Learning)1、定義機器學習 (Machine Learning) 是近 20 多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。簡而言之,機器學習是通過學習老知

原创 05 神經網絡(NNs)

神經網絡(Neural Networks)1、定義神經網絡是由具有適應性的 簡單單元組成的 廣泛並行互聯的網絡,它的組織能夠模擬生物神經系統 對真實世界物體 所做出的交互反應。神經網絡的基本組成部分是神經元模型。感知機——神經網絡的基本組

原创 04 支持向量機(SVM)

支持向量機(Support Vector Machine)1、定義支持向量機(Support Vector Machine,SVM)支持(support)向量(vector)指的就是樣本點機器(Machine)支持向量機它是針對線性可分情

原创 02 隨機森林(RF)

隨機森林(Random Forest,RF) 1、定義隨機森林指的是利用多棵樹對樣本進行訓練並預測的一種分類器隨機森林顧名思義,是用隨機的方式建立一個森林,森林裏面有很多的決策樹組成,隨機森林的每一棵決策樹之間是沒有關聯的。在得到森林之後

原创 03 樸素貝葉斯(NBM)

樸素貝葉斯(Naive Bayesian Model)1、定義:貝葉斯定理是關於隨機事件A和B的條件概率(或邊緣概率)的一則定理。其中P(A|B)是在B發生的情況下A發生的可能性。 貝葉斯法事概率論你框架下實施決策的基本方法,對分類任務來

原创 python爬蟲之Scrapy爬蟲框架

1、windows下安裝Scrapy框架cmd進入命令行模式pip install scrapy然後就是靜靜的等待安裝完成常見問題:pip版本有可能太舊,此時只需要更新一下pip就好                (命令行中輸入更新代碼:

原创 python抓取一個網頁的源代碼並存儲到本地文件

1.1讀取一個網頁的源代碼:url:我們要爬取的網頁鏈接(例如:url = “https://www.hao123.com”)#讀取一個網頁的源代碼import urllib.request def read_pageHtml(url):

原创 金融百詞斬—week01

共享經濟——共享單車折現值——貸款對衝基金——(套路滿滿,計謀滿滿,智慧滿滿)機會成本——一個女生與一羣女生邊際效用——第二塊巧克力比較優勢——鄧亞萍打乒乓球與做生意價格歧視——會員價與非會員價有限合夥——三國劉關張+倒黴眼瞎亮公積金——

原创 債券與股票

小王想開一個飯店,進行了前提評估。在所有事情都準備好了,就差最後資金的問題。小王開這個飯店需要100萬的本金,但是呢,小王自己只有30萬。這個時候小王就想辦法了。首先他向他的好朋友小張借了30萬,並和他簽訂條約,承諾每年給他10%每年的利

原创 Word2vec和Doc2vec原理理解並結合代碼分析

一直在用Word2vec和Doc2vec做Word Embedding和Sentence/Document EMbedding,但是剛開始用的時候對其原理一直是一知半解,只是知道怎麼用而已。古人云:既要知其然,也要知其所以然。所以,結合作

原创 04-卷積神經網絡(CNN)

卷積神經網絡傳統神經網絡存在的問題權值太多,計算量太大         (權值參數 = v0*v1個)權值太多,需要大量樣本進行訓練 最好樣本的數量是網絡權值數量的3到5倍,這樣效果纔好(經驗之談,並沒有科學依據)局部感受野1962年哈

原创 投資理財——week05

分級基金——