原创 十分鐘入門Matplotlib

什麼是 Matplotlib? 簡單來說,Matplotlib 是 Python 的一個繪圖庫。它包含了大量的工具,你可以使用這些工具創建各種圖形,包括簡單的散點圖,正弦曲線,甚至是三維圖形。Python 科學計算社區經常使用它完成數

原创 調試和編寫程序方法

當出現語法錯誤或者運行錯誤時 錯誤信息會很多,但是通常有用部分是: 是哪類錯誤在哪兒出現是應該花一些時間仔細閱讀錯誤信息,但是不要輕易的認爲錯誤信息的提示都是準確的,特別是錯誤信息的位置,有時候並不是真正的繁盛錯誤的地方。 增量式開發(i

原创 python細節

1、對元組組成的列表進行排序時,我們使用的是sort方法 sort 會按照元組中第一位置的元素進行排序,如果爲數字,則進行關於數字的排序,如果爲字符,則按照字母的順序進行排序 a=[('w',3),('d',1),('s',5),('t'

原创 爬蟲

request 常用的幾種方法: xpath Xpath解析網頁的流程:1.首先通過Requests庫獲取網頁數據2.通過網頁解析,得到想要的數據或者新的鏈接3.網頁解析可以通過 Xpath 或者其它解析工具進行,Xpath 在是一個非

原创 算法

算法是一個機械的過程,每一步都是依據一組簡單的規則跟着上一步來執行的。人們輕輕鬆鬆或者下意識自然而然做的一些事情,往往是最難用算法來表達的。

原创 使用python進行科學計算:Numpy入門

你可以用 NumPy 做很多有趣的事情。 NumPy 是一個運行速度非常快的數學庫,主要用於數組計算。它可以讓你在 Python 中使用向量和數學矩陣,以及許多用 C 語言實現的底層函數,你還可以體驗到從未在原生 Python 上體驗

原创 用python讀取以及存儲數據數據

讀寫文件,用到 with open() 語句:with open(name,mode,encoding) as file: file.write() #note:with open()後面的語句要有一個縮進name:包含文件名稱的

原创 爬蟲基本流程

爬蟲的定義:請求網站並提取數據的自動化程序put請求的參數會包含在url中,而post則不會響應體就是源代碼.先得到文件的類型,就是源代碼,然後在繼續請求內置的各種鏈接,一般都是圖片啊,視頻之類的.如何來解析?爲什麼我們抓到的數據和瀏覽器

原创 第二章:變量、表達式和語句

1.python3的關鍵子False class finally is return None

原创 用python爬取開放數據

作者:王樹義 鏈接:https://www.jianshu.com/p/424e1c65f424 來源:簡書 分別介紹如何把 CSV/XML/JSON這三種常見的網絡開放數據格式讀取到python,形成結構化數據框,方便後續分析操作

原创 python多版本共存配置

ubuntu系統一般會自帶一個python2.7的版本,如果下載anaconda3.6的話.那麼系統就會有兩個python版本,那麼如何召喚不同的python版本呢.首先在終端用echo $PATH如此以來就會列出這個系統下目前的所有環境

原创 迭代

所謂迭代(iteration),就是重複運行某個代碼塊的能力。其實遞歸就是一種利用遞歸進行迭代的方式,還有for循環方式,此外還有while循環方式。        總結:利用遞歸或者循環的方式來重複執行一組語句的過程。 首先來再次探討

原创 python:字符串

字符串是由字符組成的序列(sequnence),所以它是有序的。可以用括號運算符-[ ]-中括號來訪問元素,與c/c++一樣,但是matlab訪問元素的符號是小括號-(). 括號中的表達式叫做索引(index),和c/c++一樣,索引是

原创 爬蟲基本原理詳解

爬蟲的定義:請求網站並提取數據的自動化程序put請求的參數會包含在url中,而post則不會響應體就是源代碼.先得到文件的類型,就是源代碼,然後在繼續請求內置的各種鏈接,一般都是圖片啊,視頻之類的.如何來解析?爲什麼我們抓到的數據和瀏覽器

原创 爬蟲學習隨筆

BeautifulSoup庫與selenium庫兩個庫函數的命名規則都是下劃線連接的。