原创 機器學習之樸素貝葉斯分類器

樸素貝葉斯分類器 (naive bayes classifier, NBC) 是一種常見且簡單有效的貝葉斯分類算法。對已知類別,樸素貝葉斯分類器在估計類條件概率時假設特徵之間條件獨立。這樣的假設,可以使得在有限的訓練樣本下,原本難以計算

原创 機器學習之邏輯迴歸

邏輯迴歸 (logistic regression) 是一種可以用於分類的迴歸算法,多用於二分類任務。 Sigmoid 函數 我們爲了解決分類問題,可以忽視 \(y\) 是離散值的情況來使用我們線性迴歸算法,通過 \(x\) 來預測 \

原创 Python 的列表生成器

列表生成器爲創建列表提供了一種簡潔的方式。 比如說,我們可以這樣實現一個平方數列表 squares=[x**2 for x in range(10)] 或者這樣迭代一個字符串來生成列表 >>> s = 'hello world' >>>

原创 《Sequence Models》課堂筆記

Lesson 5 Sequence Models 這篇文章其實是 Coursera 上吳恩達老師的深度學習專業課程的第五門課程的課程筆記。 參考了其他人的筆記繼續歸納的。 符號定義 假如我們想要建立一個能夠自動識別句中人名地名等位置的序

原创 《Structuring Machine Learning Projects》課堂筆記

Lesson 3 Structuring Machine Learning Projects 這篇文章其實是 Coursera 上吳恩達老師的深度學習專業課程的第三門課程的課程筆記。 參考了其他人的筆記繼續歸納的。 遷移學習 (Tran

原创 Python 的 Collection 庫

Collections 是 Python 內建的一個集合模塊,提供了許多額外的數據類型。 namedtuple namedtuple 主要用來生成可以使用名稱來訪問元素的數據對象,通常用來增強代碼的可讀性。 namedtuple 是一個

原创 菲律賓薄荷島遊記 & 攻略

2019年的4月跑去薄荷島玩了!其實是一個比較小衆的海島,感覺那邊還是比較窮的,但是景色真的好好啊!而且我們兩個人,最後包括前期買水母服、浮潛面罩、防曬霜什麼的,總共花費才人均5000+,非常划算了! 由於時豬的假期比較緊張,我們實際純

原创 百度地圖POI爬取

我們研究生的課程內容,做下筆記記錄一下。 使用的python環境是python3.7 用的圖大部分都是老師ppt裏的圖,懶得自己截了…… 申請百度開發者密匙 (1)註冊百度用戶,註冊過的話,直接登錄就可以。登錄地址爲百度地圖開放平臺 (

原创 如何將txt文件轉換爲帶章節目錄的mobi文件

txt文件基本沒什麼排版可言。所以想要把txt轉換爲mobi文件方便閱讀。 具體步驟如下: 打開txt 用notepad++打開所需要轉換的txt文件。(或者使用其他的能夠支持正則表達式的編輯器)。 比如說我打開的是《探虛陵古代篇》。

原创 【翻譯】學術寫作中的數字

學術寫作中的數字 本文翻譯自 University of New England 的網絡資源。原文 pdf 可通過超鏈接下載。 英語水平一般,主要翻譯用於自己學習,輕噴。 學術寫作中的數字寫作規則在各個學術領域中各有不同。對於非學術

原创 字典 (dictionary) 的默認值

字典 (dictionary) 的默認值 摘錄自《利用 Python 進行數據分析》第三版 3.1.4.2 通常,如果想要獲得字典裏對應鍵的值,但是我們先前並不確定這個鍵是否存在於字典中的話,代碼會這樣寫 if key in som

原创 使用 joblib 對 Pandas 數據進行並行處理

使用 joblib 對 Pandas 數據進行並行處理 如果需要對一個很大的數據集進行操作,而基於一列數據生成新的一列數據可能都需要耗費很長時間。 於是可以使用 joblib 進行並行處理。 假設我們有一個 dataframe 變量 d

原创 關於 About

關於我 我是 Ivy,目前武漢大學 GIS 專業在讀碩士研究生,業餘渣程序媛。 寫了一些不起眼的代碼(參看我的 GitHub),做了一些不起眼的小研究(參看我的 ResearchGate)。 關於本站 本博客主要就是自己記錄學習生活的互

原创 Numpy 庫

可以直接通過pip安裝。 pip install numpy 1 NumPy的數值類型 每一種數據類型都有相應的轉換函數。使用dtype屬性可以查看數組的數據類型。如下。 2 數組操作 使用arange()函數可以來生成數組。 2

原创 常用的機器學習算法

大類 小類 算法名稱 特點 典型應用場景 監督學習 分類 支持向量機 (support vector machine) 對線性和非線性數據的二分類問題都支持;但對於多分類問題的效果不佳 文本分類;圖像識別;目標檢測 人工神經網絡