原创 Day01-初識Python

Day01-初識Python 本文轉自GitHub文章:Python - 100天從新手到大師 https://github.com/jackfrued/Python-100-Days Python簡介 Python的歷史 1989

原创 【Python 3 機器學習基礎】嶺迴歸

嶺迴歸是一種用於迴歸的線性模型,因此它的預測公式與普通最小二乘法相同。但在嶺迴歸中,對係數(w)的選擇不僅要在訓練數據上得到好的預測結果,而且還要擬合附加約束。我們還希望係數儘量小。換句話說,w的所有元素都應接近於0.直觀上來看,這意

原创 爬取豆瓣《將夜》點評

《將夜》是根據貓膩小說改編,陳飛宇和宋伊人主演,最近在騰訊視頻熱播的電視劇,閒來無事,在學Python爬蟲的時候想要爬取評論看看。幾經努力,菜鳥水平終於能夠爬取短評了。由於豆瓣的限制,即使在登錄的狀態,依然只能爬取500條評論,具體代

原创 【Python3 爬蟲學習筆記】人臉識別及驗證碼圖片破解

用OpenCV讀取和顯示圖形 OpenCV(Open Souce Computer Vision Library)是一個跨平臺的計算機視覺庫。OpenCV由英特爾公司發起並參與開發,可在商業和研究領域中免費使用。OpenCV可用於開發

原创 【Python3 爬蟲學習筆記】人臉識別及驗證碼圖片破解 3

用OpenCV進行人臉識別 要對特定圖像進行識別,最關鍵的是要有識別對象的特徵文件,OpenCV已內置了人臉識別特徵文件,我們只需使用OpenCV的CascadeCoassifier類即可進行識別。 創建CascadeClassifi

原创 【Python3 爬蟲學習筆記】Pandas:強大的數據處理套件 2

DataFrame數據的修改及排序 DataFrame數據的修改 修改DataFrame數據的操作非常簡單,只需要把上例中讀取的數據項設定爲指定值即可。例如,把陳聰明的數學成績修改爲91: df.ix["陳聰明"]["數學"] = 9

原创 【Python3 爬蟲學習筆記】人臉識別及驗證碼圖片破解 2

OpenCV基本繪圖 OpenCV提供了繪製直線、圓形、矩形等基本繪圖功能。 OpenCV畫直線的語法爲: cv2.line(畫布, 起點, 終點, 顏色, 寬度) 顏色:000到255的數值列表,如(120,80,255)。注意

原创 【Python3 爬蟲學習筆記】Pandas:強大的數據處理套件

創建DataFrame數據 用Pandas套件進行數據處理,首先要導入Pandas套件。 import pandas as pd 創建DataFrame的語法爲: 數據變量 = pd.DataFrame(數據類型) “數據類型”可

原创 【Python3 爬蟲學習筆記】用Python進行Word文件操作

用Win32com組件操作Word文件 Python語言可通過Win32com組件對Microsoft Office文件進行存取,而且Python已內置了Win32com組件,不需要另外安裝。 要用Win32com組件操作Micros

原创 【Python3 爬蟲學習筆記】繪製圖形

Python 除了擅長於數據抓取,把抓到的數據繪製成統計圖形更是它的強項。 Matplotlib 是Python在2D繪圖領域使用最廣泛的組件,通過它可以讓用戶輕鬆地將數據圖形化,並且提供了多種輸出格式。Matplotlib功能強大,

原创 【Python3 爬蟲學習筆記】繪製圖形 4 -- Bokeh包 2

散點圖 除了繪製線形圖的功能外,Bokeh還可用於繪製多種散點圖,即僅顯示各座標點而不進行連接。 繪製散點圖的語法爲: 繪圖區變量.circle(x座標表, y座標表, size=大小, color=顏色, alpha=透明度) 大

原创 【Python3 爬蟲學習筆記】繪製圖形 2

爬取並繪製我國GDP1990~2016數據圖 繪製圖形所需的數據源通常是不固定的,比如,有時我們會需要從網頁抓取,也可能需從文件或數據庫中獲取。利用網頁數據抓取技術,把我國1990年到2016年的GDP數據抓取出來,再利用Matplo

原创 【Python3 爬蟲學習筆記】繪製圖形 3 -- Bokeh包

Matplotlib在繪製各種科學圖形方面功能強大,但佔用的內存空間及計算資源也很大。如果繪製的圖形不太複雜,小巧的Bokeh包就夠用了。Bokeh的大小隻有Matplotlib的五分之一,並且其所繪製的圖形還是在網頁中顯示。 用Bo

原创 【Python3 爬蟲學習筆記】爬取喜馬拉雅《寶寶巴士-奇妙三字經》

最近發現,娃喜歡睡覺之前聽《三字經》,又不想給他玩手機,遂起心將喜馬拉雅FM上的音頻下載下來的想法。 在網上搜到了一篇文章,介紹瞭如何爬取:https://blog.csdn.net/majiexiong/article/detail

原创 【Python 3 爬蟲學習筆記】使用Python3 爬取貓眼《西虹市首富》

轉自微信公衆號《數據森麟》 直接上代碼: # 調用相關包 import json import random import requests import time import pandas as pd import os from