原创 深度學習優化問題

Learning Rate 學習速率應通過訓練成本來確定,如果訓練成本一直在降低,且降得比較快,那麼可適當調大學習速率。否則,應該取較小的學習速率避免“步長太大,越過谷底”。因爲學習速率僅僅影響着最終的準確率,所以沒必要選擇驗證

原创 BatchNormalization 原理及代碼實現

轉載自:http://blog.csdn.net/elaine_bao/article/details/50890491 原理講解 本次所講的內容爲Batch Normalization,簡稱BN,來源於《Batch Normal

原创 Python入門語法要點

Python入門語法要點 首先要說一下博主是有一丟丟C語言基礎的,所以本博審略了一些基本的內容o(^▽^)o,若有不對的地方,還請大家批評指正!共同進步! dict 訪問dict dict就是存儲Key-Value鍵值對的數據結

原创 python 讀取帶BOM的utf-8格式文件

** UTF有哪些分類? ** UTF-8分爲兩種,一種是不帶BOM的,一種是帶BOM的。其中第一種不帶BOM的是標準形式,第二種帶BOM的主要是微軟的習慣。 ** 爲什麼有BOM的UTF-8? ** 微軟在UTF-8中

原创 Python---Numpy

爲什麼要有Numpy? 標準的python使用list來保存一組值,用來當作數組使用,但此時裏面存放的是指針,則重結構用於做數值運算比較浪費內存和CPU計算時間。 此外python還有一個array模塊,它直接保存數值,但不支

原创 深度學習各種優化函數詳解

深度學習中有衆多有效的優化函數,比如應用最廣泛的SGD,Adam等等,而它們有什麼區別,各有什麼特徵呢?下面就來詳細解讀一下 一、先來看看有哪些優化函數 BGD 批量梯度下降 所謂的梯度下降方法是無約束條件中最常用的方法。假設

原创 windows10安裝ubuntu教程+tensorflow(文字簡版)

最開始折騰win10+tensorflow,試過各種途徑,都陣亡。 雖說最新版的tensorflow已經支持windows了,但是隻兼容python3.5。 於是,還是裝了雙系統。 據說win10安裝ubuntu很多坑,於是我

原创 生成模型和判別模型的區別

1.監督學習分爲生成模型和判別模型 有監督機器學習方法可以分爲生成方法和判別方法(常見的生成方法有混合高斯模型、樸素貝葉斯法和隱形馬爾科夫模型等,常見的判別方法有SVM、LR等),生成方法學習出的是生成模型,判別方法學習出的是判別

原创 各種開源NLP自然語言處理工具集錦

開源NLP自然語言處理工具集錦 現狀 首先看看目前常用的分詞系統: No Name Feature 1 BosonNLP http://bosonnlp.com/ 2 IKAnalyzer http://git.

原创 機器學習——最小二乘法

整理了一個PPT形式的~如下: 歡迎補充及批評指正!

原创 小白從頭開始編寫第一個Django的Hello World(Mac)

爲什麼要選Django? Django考慮了很多在Web編程中會遇到的麻煩,因此你可以專注於編寫應用層面的邏輯,而不用考慮太多Web問題。 Django是免費且開源的。 快速開發 功能完善:Django包含數十個附加功能,可用於

原创 卷積神經網絡(CNN)應用於自然語言處理(NLP)

說到CNN,大家自然想到圖像處理。 說到NLP,大家自然想到LSTM,RNN。 但是,去年的斯坦福論文表明,CNN照樣可以應用於NLP,並且效果可能更好。 博主做了實驗,爬取了各類新聞並對新聞進行分類。這樣的分類問題,RNN和

原创 ubuntu + nohup

想要讓python程序在後臺執行(默認python文件名爲xxx): nohup python xxx.py & 此時文件輸出被追加到nohup.out文件中。如果已經存在nohup.out文件,則建議先將其備份刪掉,再執行

原创 未登錄詞處理優秀論文——Pointing the Unknown Words

論文: 《Pointing the Unknown Words》 作者: Caglar Gulcehre、Sungjin Ahn、Ramesh Nallapati、Bowen Zhou、Yoshua Bengio 這篇論文

原创 如何查看keras的默認backend

1 . 進入當前用戶目錄: cd ~ 2 . 查看當前目錄下的文件: ls -a 3 . 找到.keras目錄並進入: cd .keras 4 . 進入並查看keras.json文件: cat keras.json 5 . 可能的顯示如下