原创 爬蟲系列-正則表達式

我們常常總是說在處理字符串一類數據的時候,總會提到一個正則表達式,但每次別人提到是又愛又恨的感受,它雖然是一個萬能的辦法,但是它相比其他幾個,麻煩很多,一般都不會用它,但它一般都是我們最後的殺手鐗,我們在寫爬蟲的時候也少不它。 文

原创 python內置函數功能彙總

python內置函數介紹 內置函數介紹 官網內置函數介紹 常用內置函數 abs(x) 返回一個數的絕對值。實參可以是整數或浮點數。如果實參是一個複數,返回它的模。 abs(3)#結果還是3 all(iterable) 如

原创 rgb顏色查詢對照

這個看了一下別人的博客,覺得寫得很不錯,就直接轉載,有興趣的可以看一下。 https://blog.csdn.net/u010997144/article/details/52084386

原创 seaborn繪圖包的使用

文章目錄Seaborn概述seaborn提供的一些功能內置數據集準備工作調用在線數據集seaborn主題風格與調色板設定主題風格sns.set_context()調色板seaborn.color_palette()seaborn.

原创 python 神奇的第三方庫 -Faker

在做數據處理和數據分析的時候,我們總是少不了測試數據,比如你想對設一個合理的數據清洗方案,但有的時候事先能夠找一些樣例做測試,但大多數的情況是我們自己構建一個測試數據。但對於我這個選擇困難症的人,每次想名字或者定一些其他東西都是很

原创 python基於Matplotlib模塊的繪圖2

上一篇博客簡單介紹了一些如何進行繪圖,和如何設置各種圖形格式,這篇博客主要講解一下一些細節部分以及具體的實例操作。 文章目錄實例1繪製多子圖分段函數繪製 實例1 有時我們需要繪製一個圖形,需要指定它的大小並且將其輸出保存下來,這個

原创 time和datatime的使用

time標準庫的使用 time是python處理時間的標準庫,調用方法和其他python各種庫的使用是一樣的。 import time time標準庫的函數主要分爲三大類函數:時間獲取,時間格式化,程序計時 1.時間獲取 時間格

原创 python基於Matplotlib模塊的繪圖1

Matplotlib模塊 Matplotlib模塊是python中繪圖的第三方庫,它模仿MATLAB中繪圖,既適合交互式地進行製圖,也可以作爲繪圖控件方便地嵌入GUI應用程序中。其中最主要的Matplotlib的pyplot子庫提

原创 python邏輯迴歸識別貓(持續更新中)

邏輯迴歸 簡單來說, 邏輯迴歸(Logistic Regression)是一種用於解決二分類(0 or 1)問題的機器學習方法,用於估計某種事物的可能性。比如某用戶購買某商品的可能性,某病人患有某種疾病的可能性,以及某廣告被用戶點

原创 爬蟲系列-urllib基本庫的使用

學習爬蟲,最基礎便是模擬瀏覽器向服務器發出請求,請求需要來我們自己來構造?以及如何構造?具體怎麼實現?服務器的響應和應答原理是什麼樣的? 可能我們對這些一無所知,但python提供了功能齊全的類庫來幫助我們完成這些請求。常用的HT

原创 python調用百度API對數據進行情感分析

百度Al 大家平常是不是被深度學習和機器學習的一些需要打標籤的訓練數據所困擾,小編也是這樣,特別是利用深度學習進行情感分析的時候,正負面數據進行打標籤是一個很繁瑣的工作,人工打標籤耗費時間長,成本高。最近小編在尋找數據的時候發現了

原创 python爬蟲個人總結篇1

結合我之前大半年的寫爬蟲經歷,遇到了各種問題,然後最近這段時間也不會怎麼碰爬蟲,所以我結合之前的經歷和遇到的各種坑,寫了這一篇總結性的文章。 首先和大家說一下python數據分析,如果大家不知道python對數據分析的流程大體

原创 python列表的用法

列表 序列是Python中最基本的數據結構。序列中的每個元素都分配一個數字 - 它的位置,或索引,第一個索引是0,第二個索引是1,依此類推。 Python有6個序列的內置類型,但最常見的是列表和元組。列表是最常用的Python數據

原创 微信公衆號信息爬取

微信公衆號信息爬取 微信公衆號文章信息爬取利用的是搜狗的微信文章搜索,通過搜索頁面的結合找對應關鍵詞的文章 https://weixin.sogou.com/ 代碼的大致介紹 考慮到訪問頻繁容易封ip 這裏採用了阿布雲的IP

原创 強大的python繪圖包plotly包

plotly包介紹 plotly是現代平臺的敏捷商業智能和數據科學庫,它作爲一款開源的繪圖庫,可以應用於Python、R、MATLAB、Excel、JavaScript和jupyter等多種語言,主要使用的js進行圖形繪製,實現過