【爬蟲計劃】Scrapy框架的學習及跟課學習 | csdn_Part 01 認識Scrapy框架

【引言】 

深夜的寧靜,好像更適合學習,尤其是一個人的房間。晚上跟老朋友打了電話,談論現在和未來。挺好的,比以前坦誠,比以前更相信努力有用。所以加上晚飯前後跟導師的討論,包括技術棧的需要,終於對爬蟲框架動手了。另:這是買數據分析挖掘課程送得五個課程之一。

全課程接近四個小時,最好兩天搞定,快速上手並完成項目部署基本操作。

 


目錄

 1.介紹Scrapy

 2.Scrapy框架的安裝

 3.Scrapy框架的使用


 1.介紹Scrapy

課程從Scrapy框架的介紹開始,使用語言是Python,包括步驟、用途。

 隨後用了一張官網上的運行原理圖來介紹了Scrapy的結構,注意其中幾個關鍵的流程,關鍵部件,中間件。

 2.Scrapy框架的安裝

使用pip命令來安裝

pip install scrapy

安裝完成後,到安裝的路徑下打開命令行使用以下命令查看安裝的版本:

scrapy version

 這裏要記錄其中遇到的問題,有一個博文幫助解決了。裝scrapy的時候因爲是手機APN支持的辦公,所以牆上加強,下載非常慢,經常出現time out的情況,朋友提供思路可以替換鏡像源,所以今天一開始就沒有嘗試按照規矩套路走。對照着這個連接完成了scrapy的安裝,階梯爲證,這裏把原博主貼出來。pip換源 安裝scrapy【臨時/永久兩種方法】,感謝博主,接着往後走。

3.Scrapy框架的使用

  重點在於介紹命令/爬蟲案例

3.1Scrapy庫框架的命令介紹

  • 命令分爲兩種全局命令和項目命令 ,包括幾個常用命令可以常用常新:

老師對全局命令進行演示,也跟着練習了一下,其中對於幾個命令比較感興趣,fetch和shell~

其中,選取shell命令進行練習,對百度網站進行測試爬蟲。

然後對爬取結果進行選取輸出。其中xpath內直接用結構解析網頁內容。

對scrapy命令進行練習後,可以創建新項目試試,依舊是在命令行界面,這裏我爲了方便管理代碼文件,在指定目錄下打開命令行,重新輸入:

scrapy startproject demo1(項目名)

回車後出現成功結果,確實在指定目錄下完成了項目demo1的創建:

 輸入命令cd demo1以後進入項目內,繼續使用scrapy命令,出現前面介紹的項目命令,與全局命令更多的是對於項目進程的操作命令:

 這節部分就到這裏,後面老師會帶着做一個基於scrapy實現的我愛我家項目,放在另一篇博文來補充。

Slogan:刻意練習,每日精進。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章